计算机行业动态研究:GPT-4o、Gemini新品接连发布,多模态技术奇点加速到来-240516-国海证券-19页

计算机行业动态研究:GPT-4o、Gemini新品接连发布,多模态技术奇点加速到来-240516-国海证券-19页_第1页
计算机行业动态研究:GPT-4o、Gemini新品接连发布,多模态技术奇点加速到来-240516-国海证券-19页_第2页
计算机行业动态研究:GPT-4o、Gemini新品接连发布,多模态技术奇点加速到来-240516-国海证券-19页_第3页
2024年05月16日行业研究评级:推荐(维持)研究所:刘熹S0350523040001GPT-4o、Gemini新[Tab品le_接Tit连le]发布,多模态技术证券分析师:liux10@ghzq.com.cn奇点加速到来——计算机行业动态研究最近一年走势事件:2024年5月14日,OpenAI在官网正式发布新旗舰模型GPT-4o多模态大模型,其中o代表的是omni,即“全能”,GPT-4o可以实时对音频、视觉和文本进行推理,相较于GPT-4Trubo速度更快、价格更便宜。2024年5月15日,2024年谷歌I/O大会正式召开,会上谷歌将搜索业务做了最彻底的AI改造,更新升级了Gemini1.5Pro版本,推出Gemini1.5Flash轻量化小模型、生成视频模型Veo、AI智能体ProjectAstra,并展示了与GPT-4o相似的语音视觉交互功能GeminiLive。行业相对表现2024/05/16投资要点:表现1M3M12MGPT持续迭代,GPT-4o推动人机交互再上新台阶计算机5.1%沪深3003.7%6.2%-25.0%OpenAI持续升级GPT版本,2023年3月发布GPT-4在图片识别、图文数据综合处理及逻辑推理等能力实现质变;2023年11月发布8.2%-8.5%GPT-4Turbo,支持125万tokens的同时也在上下文等多个领域实现显著进步。本次发布GPT-4o带来各种能力升级:相关报告①多模态交互,具有更优质的视频和音频理解以及图像生成能力:《计算机事件点评:运营商AI服务器订单超预期,GPT-4o能够接受文本、音频和视频的任意组合作为输入,并生成文本、国产化不断提速(推荐)计算机刘熹》——音频和图像的任意组合作为输出。与现有模型相比,GPT-4o在视觉和音2024-04-22频理解方面有更好的表现;在理解和生成图像方面的能力优于现有模型,《计算机行业动态研究:阶跃星辰发布Step-2万能完成...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

发表评论取消回复

参与评论可获取积分奖励  
悟空文库+ 关注
实名认证
内容提供者

悟空文库-海量文档资源下载,专业/极致/认真

确认删除?
回到顶部