[Table_Page]行业专题研究电子2024年4月23日证券研究报告“AI[Table_Title]的裂变时刻”系列报告9假如L40S使用HBM显存?——对国产推理算力芯片厂商的启示分析[T师ab:l王亮分析师:耿正分析师:任思儒e_Author]SAC执证号:S0260519060001SAC执证号:S0260520090002SAC执证号:S0260524030001SFCCE.no:BFS478021-38003658021-38003660021-38003660rensiru@gf.com.cngfwangliang@gf.com.cngengzheng@gf.com.cn请注意,耿正,任思儒并非香港证券及期货事务监察委员会的注册持牌人,不可在香港从事受监管活动。[Table_Summary]核心观点:⚫前言。AIGC大时代序幕开启,国产推理算力芯片厂商迎来历史机遇;但基于大语言模型的AIGC行业需要什么707672样的推理算力芯片、如何设计更有性价比的推理产品?我们在此前已发表报告《“AI的裂变时刻”系列报告3:为什么H20的推理性价比高?》中基于理论推算框架分析发现,显存性能对于GPU推理性能影响较大。为了进一步研究高带宽、大容量HBM对于算力芯片推理性能的影响,我们在本报告假设了如下产品:L40S算力参数不变,使用HBM替代GDDR作为显存方案;并基于理论推算框架推算假设产品的推理性能。结果显示使用HBM后推理性能获得大幅提升。这对于国产推理算力芯片厂商产品定义与设计带来启示:使用更高带宽、更大容量的HBM对于提升产品推理性能起到事半功倍的效果。⚫若使用HBM显存方案,L40S推理性能提升明显。根据英伟达官网,L40S是英伟达2023年发布的一款推理GPU产品,其显存方案为48GBGDDR6,显存带宽为864GB/s。我们基于理论推算框架,分析配有不同规格HBM的L40S假设产品的推理性能;推算结...
发表评论取消回复