人形机器人行业专题报告(一)-Figure×OpenAI:端到端的大语言-视觉模型让“机器”变“人”-240314-浙商证券-11页

人形机器人行业专题报告(一)-Figure×OpenAI:端到端的大语言-视觉模型让“机器”变“人”-240314-浙商证券-11页_第1页
人形机器人行业专题报告(一)-Figure×OpenAI:端到端的大语言-视觉模型让“机器”变“人”-240314-浙商证券-11页_第2页
人形机器人行业专题报告(一)-Figure×OpenAI:端到端的大语言-视觉模型让“机器”变“人”-240314-浙商证券-11页_第3页
证券研究报告行业专题机械设备机械设备报告日期:2024年03月14日Figure×OpenAI:端到端的大语言-视觉模型让“机器”变“人”——人形机器人行业专题报告(一)投资要点行业评级:看好(维持)❑Figure×OpenAI的最新视频呈现了什么亮点?分析师:张雷执业证书号:S1230521120004Figure01最新视频表明了大语言-视觉模型介入人形机器人后,所带来的极快升zhanglei02@stocke.com.cn级。近日人形机器人初创公司Figure公布其与OpenAI合作13天后的机器人最新视频,视频中OpenAI将其端到端的大语言-视觉模型移植到Figure01上,Figure研究助理:虞方林01能够1)理解区分面前的场景对象;2)动作上区分苹果和一堆纸团;3)理解自身yufanglin@stocke.com.cn行为的目的;4)判断下一步的响应动作;5)评价自身行为;6)手指灵活度足够且动作较快。就目前所呈现的状态,我们认为人形机器人有望打开C端市场。相关报告❑大语言-视觉模型对Figure01的加持体现在哪?1《特斯拉Optimus引领技术实现,国产零部件迎来机遇》源自OpenAI端到端的大语言-视觉模型是本次Figure01升级的核心,从语言输2024.03.13入开始,模型接管了一切处理,直接输出语言和行为结果,而不是中间输出一些结果,再加载其他程序处理这些结果。其中Open的大模型提供负责提供视觉推理和语言理解,而Figure的神经网络提供快速、低水平、灵巧的机器人动作,值得注意的是机器人所有行为均源自于自身学习过的。升级主要体现在以下两方面:(1)语言交互流程:研究人员将机器人摄像头中的图像输入、机载麦克风捕获的语音中的文本转录到由OpenAI训练的,可以理解图像和文本的多模态模型(VLM)中,...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

发表评论取消回复

参与评论可获取积分奖励  
悟空文库+ 关注
实名认证
内容提供者

悟空文库-海量文档资源下载,专业/极致/认真

确认删除?
回到顶部