模块一:通用人工智能的火花:以ChatGPT为代表的AI大模型的基本原理
一、从分析式AI到生成式AI,AI从做“选择/判断”题到做“填空/问答”题
二、为什么通用人工智能曙光率先在自然语言处理领域展现?
三、大语言模型的根基: NLP以及Transformer的基本核心原理
1.词的“内嵌”
2.注意力机制 - Attention is all you need: 奠定生成式AI基调的核心
3.对输入的“变形”和输出的“计算”:Transformer的编码解码原理
4.Transformer的Q.K,V矩阵及其权重矩阵
四、ChatGPT的独到之处
五、其他大模型主要类别和基本原理
1.文生图:训练机器对像素的“组装”
2.图生3D:算法对世界的“脑补”
六、大模型的“智力”、“技能”和“知识”
七、ChatGPT Code Interpreter:基于AI大模型的(数据查询/分析)代码生成
八、如何利用大模型:云服务模式
1.- Prompt engineering&in- context learning 提示词工程&上下文学习
2.如虎添翼- 为大模型加上“视觉中枢”“听觉中枢”“行动中枢”:插件 Plugin
3.如虎添翼-为大模型加上“海马体”Vector database向量数据库(大模型的长期记忆机制)
九、如何利用大模型:私有化部署 - 对开源大模型精调和定制
1.预训练
2.大模型瘦身:知识蒸馏和转移学习
3.经典调参
4.指令调参
5.参数经济型调参:Lora和Qlora
模块二:AI大模型的发展趋势
一、多模态大模型:AI的“五感”,“六感”,“多感”
二、具身智能:多模态AI和机器人会有何化学反应?
三、AI硬件的进化:多架构多形态的新型AI计算硬件
四、AI大模型会取代企业数字化系统吗?-协同合作,相互增强的AI大模型和企业级系统: Salesforce的AI战略
五、行业大模型落地路径:预训练模型 + 专业训练精调 + 行业知识库 + 插件
模块三:商汤大模型体系的产品和应用
一、商汤视觉大模型体系:书生
二、商汤开源视觉模型体系:OpenMMLab
三、商汤大模型体系SeneseNova
1.商汤大语言模型:SenseChat
2.商汤文生图模型:秒画
3.商汤数字人平台:如影
4.商汤物体三维重建模型:格物
5.商汤环境三维重建模型:琼宇
课程背景:企业在人工智能大模型时代的核心竞争力,是把自己行业/领域的专有知识经验和数据转化封装成AI模型,并将之有机联接到自身数字化体系的能力。