敬请参阅最后一页特别声明1000本篇报告继续探讨大语言模型在热点投资上的应用,是在《Beta猎手系列之七:追上投资热点——基于LLM的产业链图谱智能化生成》提出的“产业链Agent”模型的基础上做了进一步拓展,进一步提升了产业链与概念股梳理效果,并增加了识别概念领涨股的功能,帮助投资者更准确地把握行情。RAG:What,Why,How?RAG是一种优化大语言模型输出质量的技术,通过在指定数据库中检索高相关信息来提升模型回答质量,适用于垂直领域知识增强、最新知识更新、扩展上下文长度等多种应用场景。通过“海底捞针”实验我们证明,尽管大模型支持输入更长上下文,但在处理较长文本时可能出现能力下降,这也是我们必须用RAG提炼信息,实现降本增效的原因。基于查询的RAG是当前较主流的RAG框架:检索出高相关文本后通过Prompt与查询一起输入大模型,提升回答的质量。我们可以从初始查询、检索器、生成器等方面对RAG框架进行优化,其中检索器是决定RAG效果的关键。检索器包括检索算法、Embedding模型以及向量数据库的选择等,能实现对检索结果的质量以及大数据下检索效率的提升,需要使用者根据应用的特征专门挑选检索方式。产业链与概念股梳理全流程升级我们推出“产业链Agent”模型v2.0版本,全流程提升梳理结果质量。首先,我们搭建了涵盖新闻、研报、公司公告等多个来源的知识库,并针对产业链梳理与概念股梳理两种不同的任务分别进行处理;考虑到中文金融文本的特性,我们选择混合检索的算法,并创新地提出了时间加权的概念,将信息的时效性纳入考虑;此外,我们也实现对文本做进一步浓缩,以及判断可能存在的概念股映射不准的...
发表评论取消回复