证券研究报告行业动态研究国内外大模型发展情况梳理分析师:于芳博yufangbo@csc.com.cnSAC编号:S1440522030001发布日期:2024年5月15日本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请务必阅读正文之后的免责条款和声明。摘要核心观点:2022年11月30日OpenAI发布ChatGPT,随即引爆社交网络,大模型行业进入加速发展阶段。国外基础模型实力强劲、不断精进,开源模型打造庞大应用生态,端侧模型小而美。国内大模型也进入加速成长期,在过去一年中取得了实质性突破。百度文心一言、讯飞星火、清华智谱ChatGLM4、商汤“日日新SenseNova5.0”整体表现逼近GPT-4,开源模型快速进步,文生视频、文生音乐等多模态也取得突破。国内大模型网页流量和应用下载量节节攀升,大模型已经成为日常生活中的重要助手。国外大模型持续领跑,闭源、开源、端侧模型异彩纷呈。国外大模型主要分为三个层级:性能强劲的闭源模型,具备生态优势的开源模型,以及专注端侧应用的轻量模型。国外基础模型能力持续提升,闭源模型中巨头各显其才。GPT-4性能卓越,始终处于领跑地位,GPT-4o模型实现端到端信息处理,人机交互体验大幅提升;Claude3后起之秀,整体性能十分强劲;原生多模态大模型Gemini,多模态能力、跨模态能力取得突破。开源模型领域中,LLama2模型塑造了庞大的开源模型家族,LLama3能力大幅提升;Mixtral8x7B为开源领域引入专家混合技术,成为开源模型的重要力量。端侧应用需要在轻量参数和...
发表评论取消回复