科技AI应用加速,关注多模态、长文本华泰研究专题研究计算机增持(维持)2024年3月26日│中国内地计算机应用增持(维持)全球AI应用加速成长,模型突破带动多模态、长文本场景研究员谢春生自2020年开始,全球生成式AI应用加速发展,以2022年底ChatGPT发SACNo.S0570519080006布为时间分界,全球AI应用呈现“使用场景、目标客群、应用模态”全面SFCNo.BQZ938xiechunsheng@htsc.com拓展的发展趋势。1)目标客群:实现从2C(Consumer)到2B(Business)、+(86)21298720362C(Consumer)、2D(Developer)的全面覆盖;2)使用场景:实现从通用到垂直、从工具到流程、从云端到终端的不断进阶;3)应用模态:实现研究员彭钢从文本到图像、音频、视频、3D的持续丰富。我们认为,应用生态丰富的SACNo.S0570523090001本质原因在于底层模型的能力优化,综合近期大模型的迭代趋势,AI应用有penggang@htsc.com望实现多模态、长文本等场景的加速落地,AI应用生态有望实现进一步拓展。+(86)2128972228多模态:模型音、视频能力持续优化,海外应用加速迭代联系人袁泽世,PhD海外大模型迭代重视多模态能力拓展,相较于早期图像、音频、视频模型,SACNo.S0570122080053基础模型能力显著提升。1)图像:24年2月,StabilityAI发布新文生图模yuanzeshi@htsc.com型StableDiffusion3(简称SD3.0),SD3.0在多主题提示、图像质量、文+(86)2128972228本生成能力方面持续提升,同时支持用文字修改画面内容、将图像转换为视频等功能;2)视频:24年2月,OpenAI发布文生视频大模型Sora,实现行业走势图视频生成质量、时长等全面拓展;3)音频:Suno发布V3版本文生音...
发表评论取消回复