大模型自学笔记

· 2025-12-27 ·

这周终于稍微清闲了一些，找许多朋友一起聊了许多东西，关于关于职业、生活、旅行、健康，当然聊着聊着就会聊到大模型，看看其他公司大模型落地的现状。比起快手、美团、拼多多等公司，阿里和字节系确实在落地上更进一步，整体上对 AI 的拥抱程度是更上一个层次的。

让我有点讶异的是腾讯，也有可能是我身边在腾讯的朋友提供的样例不具有代表性，腾讯的大模型能力建设真的很弱，混元大模型的能力与其他同等体量的公司相比，落后了许多，但腾讯的产品又做得蛮好的，我最近用的最多的两款产品，一款是腾讯元宝，一款是 ima.copilot，都是腾讯的产品。

从这一点上来思考的话，产品的受欢迎程度，有时候与基座大模型的评分，不一定是正比的。阿里千问我也用了蛮多时间，虽然大模型评分很高，但在相同的提示词下，我个人体感上是不如 chatGPT 和 Gemini 的，甚至不如 deepseek R1，尤其是上下问长度变大的时候，通义千问的回答幻觉很大，甚至开始出现胡诌的现象，观感很不好，不知道是不是为了节约成本，限制了上下文长度。

未来半年到一年，我的计划是社招顺利 landing 和深度学习大模型应用开发。
一方面，社招顺利 landing，深耕传统后端开发的能力建设，主要深入理解新的业务，提升自己架构设计能力，另一方面则是拥抱变化，深度学习大模型应用开发。

大模型应用开发和传统的后端开发，还是有很多不同的，算是一个新的领域了。
对于新领域的学习，我觉得最难的点在于找到方向，找到正确的方向后，后续就只剩下持续学习了，一切都会水到渠成的。

所以最近一直在找朋友们聊天，结合和朋友们的聊天，我列了一下未来学习计划。

大体上分为以下几个大模块：

Agent
RAG
提示词工程
模型基础
SFT/RL
前沿知识
模型推理
项目实战

（感觉内容还是有点多的，持续学习，也持续更新中~）

再细分一下：

一、Agent 知识架构

1. Python 基础

学习：快速入门 Python 实战教程

2. Agent 入门 / 了解 Agent

Agent 特点
LLM 如何调用
实战：快速跑通一个 Agent

3. MCP 协议 / Function Call

MCP 协议是什么 / 特点 / 两种通信模式
实战：感受 / 体会 MCP
Function Call 的特点
实战：Agent 调用 Function Call

4. Agent 框架

框架了解
- LangChain
- LangGraph
- LangSmith
其他平台/框架
- 扣子
- Dify

5. Agent 评估方法

6. Agent 设计范式

7. 实战：复杂的 Agent 例子

二、RAG 知识架构

1. RAG入门 / 体会

RAG是什么？为什么要RAG：理解基本概念与价值。
RAG开发环境：搭建所需的开发环境。
实战：写一个简单的RAG：通过实践快速上手。

2. 向量数据库

为什么RAG要使用向量数据库：了解其必要性。
向量数据库的特点/好处：掌握其核心优势。
常见的向量数据库：认识主流工具与平台。

3. RAG的具体过程和策略

概念
- 理解RAG涉及哪些过程：从宏观上把握核心步骤。
自然语言转嵌入向量：将查询和文本转化为向量的过程。
分块
- 分块策略：掌握文本分割的方法与技巧。
文本召回
- 文本召回基础：理解召回的基本原理。
- 稠密向量 / 稀疏向量：了解两种主要的向量表示方法。
效果评估：评估RAG系统性能的指标与方法。
实战：复杂RAG例子：通过一个综合案例深化理解。

三、提示词工程

设计提示词的原则
- 明确性、具体性、提供上下文、设定角色等。
常见的提示词策略
- 零样本提示、少样本提示、思维链、指令模板等。

四、模型基础

深度学习/机器学习基础
- 神经网络基本原理、训练与优化等。
Transformer 基础
- 生成式/自回归模型：GPT 等模型的原理。
- 词嵌入：将文本转换为向量的技术。
- 编码器/解码器：Transformer 的核心架构。
- 注意力机制：模型理解上下文的关键。
不同模型对比
- 不同模型特点：对比各类大模型（如 GPT、Claude、LLaMA 等）的优劣势。
- 模型选型：根据任务需求选择合适模型的考量。
- 不同模型架构：了解自回归、编码-解码等不同架构。
模型训练流程
- 预训练 / SFT：模型训练的前两个主要阶段。
- 强化学习 / 推理：高级优化阶段与模型应用。

五、 SFT / RL (监督微调与强化学习)

常见微调策略
- 全量 / 部分参数微调
- LoRA
- Adapter Tuning
- P-Tuning
强化学习
- 概念：基本定义与原理。
- 方法：常用技术（如PPO、DPO等）。
实战：DPO / LoRA
- 怎么选型
- 数据集准备
- 用什么平台 / 怎么做的
- 如何评估和部署

六、前沿知识能力

最新论文：跟踪与研究领域前沿学术成果。
Claud、 Genimi3 pro……：了解特定前沿模型。

七、量化 / 推理

常见的推理框架：了解部署和运行模型的工具（如vLLM、TGI等）。
模型压缩策略
- 量化：降低模型数值精度以减少计算和存储开销。
- 剪枝
- 蒸馏
实战
- 量化：具体的量化实践操作。

八、设计项目实战

技术点：项目所涉及的核心技术。
深度：对技术应用的深入程度。
价值：项目的实际意义与应用价值。