RAG 摄取
摄取链路解决的是“文档如何从原始文件变成 live chunks 和 embeddings”。
摄取步骤
- 从对象存储读取原始文件
- 解析为纯文本和结构信息
- 选择生效的 chunking strategy
- 生成 chunk
- 调用 embedding service 批量向量化
- 把 chunk 写入 PostgreSQL,把向量写入 Qdrant
- 更新文档和 job 状态
Inspect 的作用
chunking_preview:提前验证切块策略vector_health:检查 source 在 Qdrant 中的 live 向量状态
Inspect 的价值是把“切块问题”和“索引问题”分开诊断,避免盲目重建。