模块一:通用人工智能的新曙光:“世界模拟器”—— 天空SORA
一、视频领域的ChatGPT时刻:SORA
1、丝滑的60秒,SORA怎么做到的?
1)视频生成AI的发展和瓶颈
2)高一致性视频的生成和编辑意味着AI的什么能力?
3)SORA用了什么机制应对了以往视频生成的挑战?
2、不仅是视频生成,更是对时间空间的理解
1)从图片到视频,像素的时间延续一致性
2)从二维模仿,到三维空间的理解和展示
3、不仅是对事物图像的生成,更是对世界事物物理规律的表达
1)SORA对光影规律的把握
2)SORA对牛顿力学、流体力学等物理规律的反映
3)游戏引擎在SORA中有什么作用?
模块二:SORA的由来和核心逻辑 —— 生成式AI集大成者
一、从分析式AI到生成式AI,AI从做判断题/选择题,到做填空/问答题:SORA作为生成式AI的典范
二、、通用人工智能曙光初现:ChatGPT为什么令人兴奋?
1、ChatGPT和SORA是什么关系?
2、SORA + ChatGPT意味着什么?
三、SORA的核心逻辑:图像生成的扛鼎模型 扩散模型 + GPT的基模型 Transformer
1、扩散模型为什么可以从无到有生成图像?
1)文生图的模型的绝对统治者:Diffusion扩散模型
2)扩散模型本质是训练机器对像素的“组装”和“组合”
3)扩散模型如何帮助SORA生成视频?
2、Transformer为什么造就了GPT: 这其实是一个把文字变成数字编码的“变形器”
1)Transformer如何理解文字?—— 文字代表的概念,其实可以用一组数字属性来描述
2)Transformer如何理解句子和逻辑?- 理解一段话,就象侦探理解一个犯罪现场
3)Transformer如何帮助SORA理解提示词和指令?
模块三:SORA的应用和未来趋势展望
一、SORA带来的产业影响
1、内容制作行业的新范式
1)短视频行业的范式变化:哪些人会出圈?
2)中长视频/影视业的变革:“人机协同”的影视业即将到来
2、游戏电竞/VR/AR/MR产业的有力驱动
1)“所说即所得”的数字空间时代近在眼前
2)开放式游戏和社交空间将成为主流
3)创作者经济开始加速
3、建筑工程/房地产等行业的数字孪生应用
1)建筑等行业的空间计算时代将开启
2)从“事后分析,到事中监控,到事前模拟”的数字孪生应用升级
4、“千人千面”的数字内容营销时代到来
1)从模板库,到实时个性化生成的内容营销
2)数字营销系统和SORA的整合机遇
5、通用人工智能之路进一步明确
1)SORA为多模态大模型的发展照亮了前路
2)AI将发展出“五感”,“六感”,“多感”
3)类SORA模型将成为AI Agent/机器人的感知系统
6、潜在问题和挑战以及机遇
1)内容过载和鉴真:专业设备和专业服务的机遇
2)IP和允许“AI生成”的版权挑战:正版会成为稀缺资源
3)对区块链的有力推动
课程背景:企业在人工智能大模型时代的核心竞争力,是把自己行业/领域的专有知识经验和数据转化封装成AI模型,并将之有机联接到自身数字化体系的能力。