Gurivo

数据质量

数据来源与质量规则

Gurivo 的目标不是把报告写得看起来完整,而是把数据来源、可信度、缓存、用户上传资料和缺失字段清楚展示出来,让每一份研究结论都可以追溯。

实时

当前请求可直接取得行情 Provider 或官方来源返回的字段。

备用

使用了次级来源、派生值、缓存或基础估算,并在报告中明确标注。

缺失

字段无法被验证,系统会保留缺失状态并说明原因。

估算

非权威数据只作为研究上下文使用,需要用户自行复核。

1. 实时行情数据

Gurivo 会优先使用已配置的行情数据 Provider,用于价格、市场指标和报价上下文。

  • 当前生产环境可接入 Finnhub 和 Alpha Vantage,前提是后台已配置对应密钥。
  • 行情响应会进入缓存,避免免费 API 额度被重复请求快速耗尽。
  • 报告会展示 Provider、数据模式、实时字段、备用字段、缺失字段和可信度提示。

2. 美股 SEC EDGAR 财报补充

当美股行情 Provider 返回缺失字段时,Gurivo 会尝试用 SEC 10-K / 10-Q 作为事实补充层。

  • 可提取字段包括 revenue、net income、operating cash flow、capex、free cash flow、cash、assets、liabilities、shares outstanding 和财报风险信号。
  • SEC filing 数据只作为可验证事实来源使用,不当作 AI 猜测结果。
  • 如果 SEC 也无法提取某个字段,该字段必须保持 missing,并在报告中说明原因。

3. A 股与港股公告策略

A 股和港股披露体系与 SEC EDGAR 不同,需要单独建设官方公告解析管线。

  • A 股路线:巨潮资讯、上交所、深交所的年报和季报。
  • 港股路线:HKEXnews 公告、年报、中报和发行人文件。
  • 在官方公告解析器返回字段之前,Gurivo 会标记缺失,而不是用记忆或模型补全。

4. 数据冲突优先级

当不同来源的数据不一致时,Gurivo 按固定优先级处理,并保留不确定性提示。

  • 历史财务事实优先采用正式财报,优先级高于行情 Provider 估算。
  • 当前价格字段优先采用新鲜实时行情,高于过期缓存。
  • 过期缓存高于 mock 或 demo fallback 数据,但必须标注为过期。
  • Provider 估算可用于上下文,但不应覆盖已验证的财报事实。

5. 缺失字段规则

缺失数据本身就是研究信号。Gurivo 不允许为了让报告完整而编造核心财务字段。

  • 缺失值会保留 missing,并尽量附带字段名、原因和来源状态。
  • 当数据可信度弱或关键字段不可用时,最终评分会被折扣。
  • AI 可以解释缺失数据的影响,但不能编造收入、现金流、负债、warrants、convertible notes 或 filing risk。

用户上传文档

用户上传的文档会作为个人研究上下文使用,可影响追问、风险提示和资料引用,但不会自动被当作已验证的行情或官方财报数据。报告会显示引用过哪些用户资料。

数据来源与质量规则 | Gurivo