Beta猎手系列之十二:RAG-ChatGPT提前布局热点概念领涨股

敬请参阅最后一页特别声明 1 000 本篇报告继续探讨大语言模型在热点投资上的应用,是在《Beta 猎手系列之七:追上投资热点——基于 LLM 的产业链图谱智能化生成》提出的“产业链 Agent”模型的基础上做了进一步拓展,进一步提升了产业链与概念股梳理效果,并增加了识别概念领涨股的功能,帮助投资者更准确地把握行情。 RAG: What, Why, How? RAG 是一种优化大语言模型输出质量的技术,通过在指定数据库中检索高相关信息来提升模型回答质量,适用于垂直领域知识增强、最新知识更新、扩展上下文长度等多种应用场景。通过“海底捞针”实验我们证明,尽管大模型支持输入更长上下文,但在处理较长文本时可能出现能力下降,这也是我们必须用 RAG 提炼信息,实现降本增效的原因。 基于查询的 RAG 是当前较主流的 RAG 框架:检索出高相关文本后通过 Prompt 与查询一起输入大模型,提升回答的质量。我们可以从初始查询、检索器、生成器等方面对 RAG 框架进行优化,其中检索器是决定 RAG 效果的关键。检索器包括检索算法、Embedding 模型以及向量数据库的选择等,能实现对检索结果的质量以及大数据下检索效率的提升,需要使用者根据应用的特征专门挑选检索方式。 产业链与概念股梳理全流程升级 我们推出“产业链 Agent”模型 v2.0 版本,全流程提升梳理结果质量。首先,我们搭建了涵盖新闻、研报、公司公告等多个来源的知识库,并针对产业链梳理与概念股梳理两种不同的任务分别进行处理;考虑到中文金融文本的特性,我们选择混合检索的算法,并创新地提出了时间加权的概念,将信息的时效性纳入考虑;此外,我们也实现对文本做进一步浓缩,以及判断可能存在的概念股映射不准的问题,并最大化发挥不同大模型的优势。 产业链梳理结果上来看,提升检索文本质量之后,我们能直接生成任意概念的产业链图谱,也能给到更加完善的图谱结果;概念股梳理结果更加准确,且我们给出的概念股组合等权指数与 Wind 人工梳理构造的指数走势基本一致,表明我们给到的概念股范围有较高准确度。 概念领涨股特征识别与领涨组合构造 模型梳理得到的概念股数量较多,我们试图通过量价特征从中找出领涨股,帮助投资者更好把握热点行情。我们以 AI手机、人形机器人、合成生物学与低空经济四个概念为例,通过复盘确认了各概念的行情启动时间点。通过检验,我们发现动量因子与非流动性因子在热点行情来临时具有一定选股效果。我们将两个因子做等权合成,同时叠加“尖峰右偏”特征做第二层筛选,并在市值大于 50 亿的个股上做筛选,构造领涨组合。从回测结果上来看,领涨组合在概念启动后的短期内相对概念指数以及 Wind 全 A 均有明显的超额收益。 风险提示 大语言模型输出结果具有一定随机性的风险;模型迭代升级、新功能开发可能会导致结论不同的风险;人工智能模型得出的结论仅供参考,可能出现错误答案的风险。 金融工程专题报告 敬请参阅最后一页特别声明 2 扫码获取更多服务 内容目录 内容目录........................................................................................ 2 图表目录........................................................................................ 2 一、RAG: What, Why, How?........................................................................ 4 1.1 为什么需要 RAG? ........................................................................ 4 1.2 为什么必须要 RAG? RAG vs 长上下文 ...................................................... 5 1.3 RAG 的架构流程与优化路径 ................................................................ 7 1.4 如何选择适当的检索算法?................................................................ 8 二、产业链与概念股梳理全流程升级............................................................... 11 2.1 多源知识库搭建......................................................................... 11 2.2 混合检索与时间加权..................................................................... 12 2.3 文本处理与大模型选择................................................................... 13 2.4 模型效果提升——产业链梳理............................................................. 13 2.5 模型效果提升——概念股梳理............................................................. 15 三、概念领涨股特征识别与领涨组合构造........................................................... 17 3.1 热点行情复盘........................................................................... 18 3.2 领涨股具备什么特征?................................................................... 18 3.3 领涨股组合增强方案..................................................................... 20 四、总结....................................................................................... 23 参考文献....................................................................................... 23 风险提示....................................................

立即下载
综合
2024-08-27
国金证券
25页
3.71M
收藏
分享

[国金证券]:Beta猎手系列之十二:RAG-ChatGPT提前布局热点概念领涨股,点击即可下载。报告格式为PDF,大小3.71M,页数25页,欢迎下载。

本报告共25页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共25页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
广联转债及正股表现情况(%)图 8:广泰转债正股表现情况(%)
综合
2024-08-27
来源:航宇转债(118050.SH)申购分析:国内航空发动机环形锻件主研制单位之一
查看原文
近一年行业指数及航宇科技股价走势
综合
2024-08-27
来源:航宇转债(118050.SH)申购分析:国内航空发动机环形锻件主研制单位之一
查看原文
同行业可比上市公司(亿元,%)
综合
2024-08-27
来源:航宇转债(118050.SH)申购分析:国内航空发动机环形锻件主研制单位之一
查看原文
公司经营现金流情况(万元)
综合
2024-08-27
来源:航宇转债(118050.SH)申购分析:国内航空发动机环形锻件主研制单位之一
查看原文
公司主要财务指标
综合
2024-08-27
来源:航宇转债(118050.SH)申购分析:国内航空发动机环形锻件主研制单位之一
查看原文
营业收入情况图 4:归母净利润情况
综合
2024-08-27
来源:航宇转债(118050.SH)申购分析:国内航空发动机环形锻件主研制单位之一
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起