大模型自学笔记
这周终于稍微清闲了一些,找许多朋友一起聊了许多东西,关于关于职业、生活、旅行、健康,当然聊着聊着就会聊到大模型,看看其他公司大模型落地的现状。比起快手、美团、拼多多等公司,阿里和字节系确实在落地上更进一步,整体上对 AI 的拥抱程度是更上一个层次的。
让我有点讶异的是腾讯,也有可能是我身边在腾讯的朋友提供的样例不具有代表性,腾讯的大模型能力建设真的很弱,混元大模型的能力与其他同等体量的公司相比,落后了许多,但腾讯的产品又做得蛮好的,我最近用的最多的两款产品,一款是腾讯元宝,一款是 ima.copilot,都是腾讯的产品。
从这一点上来思考的话,产品的受欢迎程度,有时候与基座大模型的评分,不一定是正比的。阿里千问我也用了蛮多时间,虽然大模型评分很高,但在相同的提示词下,我个人体感上是不如 chatGPT 和 Gemini 的,甚至不如 deepseek R1,尤其是上下问长度变大的时候,通义千问的回答幻觉很大,甚至开始出现胡诌的现象,观感很不好,不知道是不是为了节约成本,限制了上下文长度。
未来半年到一年,我的计划是社招顺利 landing 和深度学习大模型应用开发。
一方面,社招顺利 landing,深耕传统后端开发的能力建设,主要深入理解新的业务,提升自己架构设计能力,另一方面则是拥抱变化,深度学习大模型应用开发。
大模型应用开发和传统的后端开发,还是有很多不同的,算是一个新的领域了。
对于新领域的学习,我觉得最难的点在于找到方向,找到正确的方向后,后续就只剩下持续学习了,一切都会水到渠成的。
所以最近一直在找朋友们聊天,结合和朋友们的聊天,我列了一下未来学习计划。
大体上分为以下几个大模块:
- Agent
- RAG
- 提示词工程
- 模型基础
- SFT/RL
- 前沿知识
- 模型推理
- 项目实战
(感觉内容还是有点多的,持续学习,也持续更新中~)
再细分一下:
一、Agent 知识架构
1. Python 基础
- 学习:快速入门 Python 实战教程
2. Agent 入门 / 了解 Agent
- Agent 特点
- LLM 如何调用
- 实战:快速跑通一个 Agent
3. MCP 协议 / Function Call
- MCP 协议是什么 / 特点 / 两种通信模式
- 实战:感受 / 体会 MCP
- Function Call 的特点
- 实战:Agent 调用 Function Call
4. Agent 框架
-
框架了解
- LangChain
- LangGraph
- LangSmith
-
其他平台/框架
- 扣子
- Dify
5. Agent 评估方法
6. Agent 设计范式
7. 实战:复杂的 Agent 例子
二、RAG 知识架构
1. RAG入门 / 体会
-
RAG是什么?为什么要RAG:理解基本概念与价值。
-
RAG开发环境:搭建所需的开发环境。
-
实战:写一个简单的RAG:通过实践快速上手。
2. 向量数据库
-
为什么RAG要使用向量数据库:了解其必要性。
-
向量数据库的特点/好处:掌握其核心优势。
-
常见的向量数据库:认识主流工具与平台。
3. RAG的具体过程和策略
-
概念
- 理解RAG涉及哪些过程:从宏观上把握核心步骤。
-
自然语言转嵌入向量:将查询和文本转化为向量的过程。
-
分块
- 分块策略:掌握文本分割的方法与技巧。
-
文本召回
-
文本召回基础:理解召回的基本原理。
-
稠密向量 / 稀疏向量:了解两种主要的向量表示方法。
-
-
效果评估:评估RAG系统性能的指标与方法。
-
实战:复杂RAG例子:通过一个综合案例深化理解。
三、提示词工程
-
设计提示词的原则
- 明确性、具体性、提供上下文、设定角色等。
-
常见的提示词策略
- 零样本提示、少样本提示、思维链、指令模板等。
四、 模型基础
-
深度学习/机器学习基础
- 神经网络基本原理、训练与优化等。
-
Transformer 基础
-
生成式/自回归模型:GPT 等模型的原理。
-
词嵌入:将文本转换为向量的技术。
-
编码器/解码器:Transformer 的核心架构。
-
注意力机制:模型理解上下文的关键。
-
-
不同模型对比
-
不同模型特点:对比各类大模型(如 GPT、Claude、LLaMA 等)的优劣势。
-
模型选型:根据任务需求选择合适模型的考量。
-
不同模型架构:了解自回归、编码-解码等不同架构。
-
-
模型训练流程
-
预训练 / SFT:模型训练的前两个主要阶段。
-
强化学习 / 推理:高级优化阶段与模型应用。
-
五、 SFT / RL (监督微调与强化学习)
-
常见微调策略
-
全量 / 部分参数微调
-
LoRA
-
Adapter Tuning
-
P-Tuning
-
-
强化学习
-
概念:基本定义与原理。
-
方法:常用技术(如PPO、DPO等)。
-
-
实战:DPO / LoRA
-
怎么选型
-
数据集准备
-
用什么平台 / 怎么做的
-
如何评估和部署
-
六、 前沿知识能力
-
最新论文:跟踪与研究领域前沿学术成果。
-
Claud、 Genimi3 pro……:了解特定前沿模型。
七、 量化 / 推理
-
常见的推理框架:了解部署和运行模型的工具(如vLLM、TGI等)。
-
模型压缩策略
-
量化:降低模型数值精度以减少计算和存储开销。
-
剪枝
-
蒸馏
-
-
实战
- 量化:具体的量化实践操作。
八、 设计项目实战
-
技术点:项目所涉及的核心技术。
-
深度:对技术应用的深入程度。
-
价值:项目的实际意义与应用价值。