大语言模型(LLM)

🎓 研究生📚 专业选修

大语言模型(LLM) 超大规模预训练语言模型,展现涌现智能。 核心素养

🧬 知识点关系网络

海量无标注文本预训练微调/提示下游任务

⬆️ 预训练-微调范式,大模型成为AI基础设施。

📖 学习建议(阶梯式路径)

  1. 缩放法则 —— 模型规模、数据量、计算量增加时,损失按幂律下降。
    💡 了解Chinchilla最优缩放定律——模型与数据应同步增长。
  2. 提示工程 —— 零样本、少样本、思维链(CoT)——设计精巧的提示激发模型推理能力。
    💡 用思维链提示让模型解数学应用题,对比直接提问的效果。
  3. 指令微调 —— 用人工标注的指令-回答对微调模型,使其更好地理解人类意图。
    💡 了解InstructGPT的训练流程:SFT + RM + PPO。
  4. RLHF —— 基于人类反馈的强化学习,训练奖励模型,用PPO优化策略。
    💡 思考RLHF如何解决“对齐问题”——让模型输出有用、无害、诚实。
💡 学习贴士: 理论与代码并重,动手实现经典模型,在GPU上验证想法。

🧠 认知导航

前置依赖: 学习大语言模型(LLM)前,建议具备Python编程、线性代数、概率论基础。

后续延伸: 学完大语言模型(LLM)后,可继续深入AI的其他子领域或应用方向。

📚 核心知识点全景

🔵 已开放 · 可随时探索🟠 生长中 · 内容持续丰富🟣 探索级 · 深度拓展

🌱 为了包容与博爱的传递,为了知识平权,善智导航正在陆续深化每一个知识点页面。
下方所有知识点均已预留链接,可随时点击探索。

✨ 每个链接都是一扇门,推开即是新世界。

🏙️ 生活中的大语言模型(LLM)

💬 ChatGPT

大语言模型的对话能力,重新定义人机交互。

📝 Copilot

代码补全、文档撰写,成为开发者的副驾驶。

🎨 AI绘画

文本到图像生成,Stable Diffusion、Midjourney。

🔗 权威参考

🤖 AI陪练指令

我是一名正在学习大语言模型(LLM)的学生,请用生动易懂的方式为我讲解其核心概念,并结合AI领域的实际应用场景加以说明。

📁 更多人工智能AI指令 →