RAG 系统
RAG 子系统负责把文档摄取为可检索资产,并在聊天或调试场景里把最相关的上下文送入模型。
何时阅读本区
- 想知道文档为什么“上传了但还不能回答”
- 想理解检索链路、关键词回退、纠错来源和 debug 接口
- 想找到 RAG 的代码入口、运维入口和查表入口
子页面结构
- 架构:RAG 的职责边界和主链路
- 运行时:在线聊天检索阶段如何组织
- 摄取:上传、inspect、chunking、embedding、写库
- 运维:管理员与实施侧日常操作
- 排障:常见失效点和排查顺序
- 参考:代码入口、配置入口和相关 API
关键文件
| 路径 | 作用 |
|---|---|
ai_service/services/ingestion.py |
摄取主编排 |
ai_service/services/chunking.py |
分块策略 |
ai_service/services/embedding.py |
向量生成 |
ai_service/services/rag_retrieval.py |
在线检索主入口 |
ai_service/services/rag_debug.py |
调试报告构建 |
ai_service/orchestrator/graph.py |
聊天运行时中的 RAG 集成 |