3AAI[M]鼻思智源研究院A大模型开源生态及大模型平台实践演讲人:华为昇思MindSpore开源生态总监胡晓曼[M]昇思3AAI智源研院CONTENTS01·生态基石:AI大模型开源生态发展洞察分析02·模型底座:华为AI大模型全景架构及应用案例03·平台架构:大模型平台技术架构及技术分析智源研究院[M]鼻思01生态基石:AI大模型开源生态发展洞察分析A螺旋上升式发展、重大变革机会,从感知理解世界到生成创造世界,A增长新曲线感知理解世界生成创造世界分析数据给出建议产业辅助合成数据创造结果新产业A技术里程碑控制论NLPCV深度学习GANAI4SStableDiffusionChatGPT“图片生成文本生成AI产业发展安防-视觉ChatGPT:“三叠浪”互联网-推荐在GPT-3大模型的基础上,通过100专家系统人标注1年高质量人工数据,强化学AI重点事1956年1997年2007年2020年习所训练出的大模型图像生成:件里程碑达特茅斯会议定义:深蓝机器人战胜视觉识别超过人类AlphaFold国际象棋大师stablediffusion,DALL-E2、紫东.太蛋白质结构预测初等业界知名的可以进行图像生成的17%->58%A模型均是大模型2022年ChatGPTArtificialintelligence大规模语言模型(LLM)所现出来的能力超出预期月,使得LLM成为技术演进方向LLM从量变到质变增大模型容量有效办法从chatGPT和更多实验中发现,语言模型规模超过一定阅值增加模型参数产生了超预期的能力涌现,比如语言理解能力,意图理解能增加训练数据力,多轮对话记忆能力等;增减训练轮数文章重点考案了小样本提示任务中各种模型的涌现能力港大模型方法代势务势可行性更大规模是否能够促使更多涌现能力,LLM规模天花板在哪,将是NLP未来的重要研...
发表评论取消回复