哈喽大家好,我是小叶。

最近在实习,导师丢给我一堆 ESG(环境、社会和公司治理)相关的 PDF,让我总结一下某行业的碳排放趋势。看到那几十份几百页的文档,我当时脑子里只有一个念头:我是来写研报的,不是来练速读的。

于是,作为一个小程序媛,我决定用 RAG(检索增强生成)给自己撸个助手。

1. 为什么 RAG 是投研的“刚需”?

大家都在用 ChatGPT,但直接把研报喂给它,它会告诉你“超出 Token 限制”。
RAG 的逻辑很简单:先把文档切碎、存进向量库,等我提问时,AI 先去库里找相关的片段,再结合这些片段回答我。

我的发现:
在 ESG 领域,数据极其分散。有的在年报里,有的在社会责任报告里,有的在新闻通稿里。RAG 最大的价值,不是生成文字,而是溯源

2. 🛠️ 避坑指南:AI 的“幻觉”比你想象中更真实

刚跑通 demo 的时候,我问它:“某公司的碳中和目标是什么?”
它信誓旦旦地回答:“2030 年实现净零排放。”
我一查原件,好家伙,原件说的是“2030 年实现运营层面碳中和”。这两者差得可不是一点半点!

我的反思:
AI 的“总结能力”太强,以至于它会把模糊的概念“美化”成确定的结论。
在投研场景下,Prompt 的严谨度决定了结论的生死。我现在会强制要求模型:

  • 必须引用原文页码。
  • 如果原文没提,必须回答“不知道”。
  • 禁止对数字进行四舍五入。

3. 语义搜索的“痛点”:关键词 vs 逻辑

传统的 RAG 依赖向量相似度。如果你搜索“减排”,它能找到“减少排放”。但如果你问“治理结构的变动对环境投入的影响”,它可能就懵了。因为这是一个逻辑链条,而不是简单的关键词匹配。

实战总结:
我现在的改进方案是引入 Knowledge Graph(知识图谱)
在检索前,先用 AI 提取出文档里的实体关系(比如:CEO 变动 -> 战略调整 -> ESG 投入减少)。把向量检索和知识图谱结合起来,RAG 才能真正听懂人话。

4. 给同行的一点真心话

AI 确实能帮我们从繁重的阅读中解放出来,但它永远无法代替分析师的“洞察”。
研报的价值不在于罗列事实,而在于预测未来。AI 能帮你找到过去的证据,但决定要不要买入的那一刻,依然需要你对行业的深度理解。

碎碎念:
最近在研究如何用 Multi-Agent(多智能体)让不同的 AI 角色(比如一个看财务,一个看环境)打架,最后给我一个综合意见。感觉这种“吵架式”的研报生成,比单模态生成的鲁棒性要高得多。

合规提醒:本文提到的技术仅用于数据处理辅助,不代表任何投资观点。研报撰写需遵循合规要求。