计算机行业：国内外大模型发展情况梳理-240515-中信建投-43页

下载本文档

阅读 1774
下载 4
格式 pdf
大小 6.67 MB
约43页
2024-05-27
收藏
评论
点赞(0)
海报
举报

/43

证券研究报告行业动态研究国内外大模型发展情况梳理分析师：于芳博yufangbo@csc.com.cnSAC编号：S1440522030001发布日期：2024年5月15日本报告由中信建投证券股份有限公司在中华人民共和国（仅为本报告目的，不包括香港、澳门、台湾）提供。在遵守适用的法律法规情况下，本报告亦可能由中信建投（国际）证券有限公司在香港提供。同时请务必阅读正文之后的免责条款和声明。摘要核心观点：2022年11月30日OpenAI发布ChatGPT，随即引爆社交网络，大模型行业进入加速发展阶段。国外基础模型实力强劲、不断精进，开源模型打造庞大应用生态，端侧模型小而美。国内大模型也进入加速成长期，在过去一年中取得了实质性突破。百度文心一言、讯飞星火、清华智谱ChatGLM4、商汤“日日新SenseNova5.0”整体表现逼近GPT-4，开源模型快速进步，文生视频、文生音乐等多模态也取得突破。国内大模型网页流量和应用下载量节节攀升，大模型已经成为日常生活中的重要助手。国外大模型持续领跑，闭源、开源、端侧模型异彩纷呈。国外大模型主要分为三个层级：性能强劲的闭源模型，具备生态优势的开源模型，以及专注端侧应用的轻量模型。国外基础模型能力持续提升，闭源模型中巨头各显其才。GPT-4性能卓越，始终处于领跑地位，GPT-4o模型实现端到端信息处理，人机交互体验大幅提升；Claude3后起之秀，整体性能十分强劲；原生多模态大模型Gemini，多模态能力、跨模态能力取得突破。开源模型领域中，LLama2模型塑造了庞大的开源模型家族，LLama3能力大幅提升；Mixtral8x7B为开源领域引入专家混合技术，成为开源模型的重要力量。端侧应用需要在轻量参数和...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容