第 1 章 基础知识——大语言模型背后
- 1.1 自然语言背景
- 1.1.1 语言是智能的标志
- 1.1.2 从图灵测试到 ChatGPT
- 1.2 语言模型基础
- 1.2.1 最小语义单位 Token 与 Embedding
- 1.2.2 语言模型是怎么回事
- 1.3 ChatGPT 基础
- 1.3.1 最强表示架构 Transformer 设计与演变
- 1.3.2 生成语言模型 GPT 进化与逆袭
- 1.3.3 利器强化学习 RLHF 流程与思想
- 1.4 本章小结
第 2 章 相似匹配——万物皆可 Embedding
- 2.1 相似匹配基础
- 2.1.1 更好的 Embedding 表示
- 2.1.2 如何度量 Embedding 相似度
- 2.2 ChatGPT 接口使用
- 2.2.1 Embedding 接口
- 2.2.2 ChatGPT + 提示词
- 2.3 相关任务与应用
- 2.3.1 简单问答:以问题找问题
- 2.3.2 聚类任务:物以类聚也以群分
- 2.3.3 推荐应用:一切都是 Embedding
- 2.4 本章小结
第 3 章 句词分类——句子 Token 都是类别
- 3.1 句词分类基础
- 3.1.1 如何对一句话进行分类
- 3.1.2 从句子分类到 Token 分类
- 3.2 ChatGPT 接口使用
- 3.2.1 基础版 GPT 续写
- 3.2.2 进阶版 ChatGPT 指令
- 3.3 相关任务与应用
- 3.3.1 文档问答:给定文档问问题
- 3.3.2 模型微调:满足个性化需要
- 3.3.3 智能对话:大语言模型 = 自主控制的机器人
- 3.4 本章小结
第 4 章 文本生成——超越理解更智能
- 4.1 文本生成任务基础
- 4.2 文本摘要
- 4.2.1 什么是文本摘要
- 4.2.2 常见的文本摘要技术
- 4.2.3 基于 OpenAI 接口的文本摘要实验
- 4.3 文本纠错
- 4.3.1 什么是文本纠错
- 4.3.2 常见的文本纠错技术
- 4.3.3 基于 OpenAI 接口的文本纠错实验
- 4.4 机器翻译
- 4.4.1 什么是机器翻译
- 4.4.2 常见的机器翻译技术
- 4.4.3 基于 OpenAI 接口的机器翻译实验
- 4.5 本章小结
第 5 章 复杂推理——更加像人一样思考
- 5.1 什么是复杂推理
- 5.2 复杂推理能力的激活和改善
- 5.2.1 初步评估 ChatGPT 的推理能力
- 5.2.2 复杂推理能力的激活
- 5.2.3 大语言模型复杂推理能力的改善
- 5.3 大语言模型复杂推理能力的探讨
- 5.4 本章小结
第 6 章 工程实践——真实场景大不同
- 6.1 评测:决定是否上线的标准
- 6.1.1 为什么评测
- 6.1.2 NLU 常用评测指标
- 6.1.3 NLG 常用评测指标
- 6.2 安全:必须认真对待的话题
- 6.2.1 前 / 后处理
- 6.2.2 提示词
- 6.2.3 可控文本生成
- 6.3 网络:接口调用并不总是成功
- 6.3.1 失败
- 6.3.2 延迟
- 6.3.3 扩展
- 6.4 本章小结
第 7 章 局限与不足——工具不是万能的
- 7.1 事实性错误
- 7.1.1 错误示例
- 7.1.2 原因分析
- 7.1.3 解决方法
- 7.2 实时更新
- 7.2.1 问题示例
- 7.2.2 原因分析
- 7.2.3 解决方法
- 7.3 性能瓶颈
- 7.3.1 背景描述
- 7.3.2 原因分析
- 7.3.3 解决方法
- 7.4 本章小结
第 8 章 商业应用——LLM 是星辰大海
- 8.1 相关背景
- 8.2 影响分析
- 8.3 商业赋能
- 8.4 本章小结