这周终于稍微清闲了一些,找许多朋友一起聊了许多东西,关于关于职业、生活、旅行、健康,当然聊着聊着就会聊到大模型,看看其他公司大模型落地的现状。比起快手、美团、拼多多等公司,阿里和字节系确实在落地上更进一步,整体上对 AI 的拥抱程度是更上一个层次的。

让我有点讶异的是腾讯,也有可能是我身边在腾讯的朋友提供的样例不具有代表性,腾讯的大模型能力建设真的很弱,混元大模型的能力与其他同等体量的公司相比,落后了许多,但腾讯的产品又做得蛮好的,我最近用的最多的两款产品,一款是腾讯元宝,一款是 ima.copilot,都是腾讯的产品。

从这一点上来思考的话,产品的受欢迎程度,有时候与基座大模型的评分,不一定是正比的。阿里千问我也用了蛮多时间,虽然大模型评分很高,但在相同的提示词下,我个人体感上是不如 chatGPT 和 Gemini 的,甚至不如 deepseek R1,尤其是上下问长度变大的时候,通义千问的回答幻觉很大,甚至开始出现胡诌的现象,观感很不好,不知道是不是为了节约成本,限制了上下文长度。

未来半年到一年,我的计划是社招顺利 landing 和深度学习大模型应用开发。
一方面,社招顺利 landing,深耕传统后端开发的能力建设,主要深入理解新的业务,提升自己架构设计能力,另一方面则是拥抱变化,深度学习大模型应用开发。

大模型应用开发和传统的后端开发,还是有很多不同的,算是一个新的领域了。
对于新领域的学习,我觉得最难的点在于找到方向,找到正确的方向后,后续就只剩下持续学习了,一切都会水到渠成的。

所以最近一直在找朋友们聊天,结合和朋友们的聊天,我列了一下未来学习计划。

大体上分为以下几个大模块:

  1. Agent
  2. RAG
  3. 提示词工程
  4. 模型基础
  5. SFT/RL
  6. 前沿知识
  7. 模型推理
  8. 项目实战

(感觉内容还是有点多的,持续学习,也持续更新中~)

再细分一下:

一、Agent 知识架构

1. Python 基础

  • 学习:快速入门 Python 实战教程

2. Agent 入门 / 了解 Agent

  • Agent 特点
  • LLM 如何调用
  • 实战:快速跑通一个 Agent

3. MCP 协议 / Function Call

  • MCP 协议是什么 / 特点 / 两种通信模式
  • 实战:感受 / 体会 MCP
  • Function Call 的特点
  • 实战:Agent 调用 Function Call

4. Agent 框架

  • 框架了解

    • LangChain
    • LangGraph
    • LangSmith
  • 其他平台/框架

    • 扣子
    • Dify

5. Agent 评估方法

6. Agent 设计范式

7. 实战:复杂的 Agent 例子

二、RAG 知识架构

1. RAG入门 / 体会

  • RAG是什么?为什么要RAG:理解基本概念与价值。

  • RAG开发环境:搭建所需的开发环境。

  • 实战:写一个简单的RAG:通过实践快速上手。

2. 向量数据库

  • 为什么RAG要使用向量数据库:了解其必要性。

  • 向量数据库的特点/好处:掌握其核心优势。

  • 常见的向量数据库:认识主流工具与平台。

3. RAG的具体过程和策略

  • 概念

    • 理解RAG涉及哪些过程:从宏观上把握核心步骤。
  • 自然语言转嵌入向量:将查询和文本转化为向量的过程。

  • 分块

    • 分块策略:掌握文本分割的方法与技巧。
  • 文本召回

    • 文本召回基础:理解召回的基本原理。

    • 稠密向量 / 稀疏向量:了解两种主要的向量表示方法。

  • 效果评估:评估RAG系统性能的指标与方法。

  • 实战:复杂RAG例子:通过一个综合案例深化理解。

三、提示词工程

  1. 设计提示词的原则

    • 明确性、具体性、提供上下文、设定角色等。
  2. 常见的提示词策略

    • 零样本提示、少样本提示、思维链、指令模板等。

四、 模型基础

  1. 深度学习/机器学习基础

    • 神经网络基本原理、训练与优化等。
  2. Transformer 基础

    • 生成式/自回归模型:GPT 等模型的原理。

    • 词嵌入:将文本转换为向量的技术。

    • 编码器/解码器:Transformer 的核心架构。

    • 注意力机制:模型理解上下文的关键。

  3. 不同模型对比

    • 不同模型特点:对比各类大模型(如 GPT、Claude、LLaMA 等)的优劣势。

    • 模型选型:根据任务需求选择合适模型的考量。

    • 不同模型架构:了解自回归、编码-解码等不同架构。

  4. 模型训练流程

    • 预训练 / SFT:模型训练的前两个主要阶段。

    • 强化学习 / 推理:高级优化阶段与模型应用。

五、 SFT / RL (监督微调与强化学习)

  1. 常见微调策略

    • 全量 / 部分参数微调

    • LoRA

    • Adapter Tuning

    • P-Tuning

  2. 强化学习

    • 概念:基本定义与原理。

    • 方法:常用技术(如PPO、DPO等)。

  3. 实战:DPO / LoRA

    • 怎么选型

    • 数据集准备

    • 用什么平台 / 怎么做的

    • 如何评估和部署

六、 前沿知识能力

  1. 最新论文:跟踪与研究领域前沿学术成果。

  2. Claud、 Genimi3 pro……:了解特定前沿模型。

七、 量化 / 推理

  1. 常见的推理框架:了解部署和运行模型的工具(如vLLM、TGI等)。

  2. 模型压缩策略

    • 量化:降低模型数值精度以减少计算和存储开销。

    • 剪枝

    • 蒸馏

  3. 实战

    • 量化:具体的量化实践操作。

八、 设计项目实战

  1. 技术点:项目所涉及的核心技术。

  2. 深度:对技术应用的深入程度。

  3. 价值:项目的实际意义与应用价值。