跳转至

RAG 系统

RAG 子系统负责把文档摄取为可检索资产,并在聊天或调试场景里把最相关的上下文送入模型。

何时阅读本区

  • 想知道文档为什么“上传了但还不能回答”
  • 想理解检索链路、关键词回退、纠错来源和 debug 接口
  • 想找到 RAG 的代码入口、运维入口和查表入口

子页面结构

  • 架构:RAG 的职责边界和主链路
  • 运行时:在线聊天检索阶段如何组织
  • 摄取:上传、inspect、chunking、embedding、写库
  • 运维:管理员与实施侧日常操作
  • 排障:常见失效点和排查顺序
  • 参考:代码入口、配置入口和相关 API

关键文件

路径 作用
ai_service/services/ingestion.py 摄取主编排
ai_service/services/chunking.py 分块策略
ai_service/services/embedding.py 向量生成
ai_service/services/rag_retrieval.py 在线检索主入口
ai_service/services/rag_debug.py 调试报告构建
ai_service/orchestrator/graph.py 聊天运行时中的 RAG 集成

相关页面