跳转至

RAG 摄取

摄取链路解决的是“文档如何从原始文件变成 live chunks 和 embeddings”。

摄取步骤

  1. 从对象存储读取原始文件
  2. 解析为纯文本和结构信息
  3. 选择生效的 chunking strategy
  4. 生成 chunk
  5. 调用 embedding service 批量向量化
  6. 把 chunk 写入 PostgreSQL,把向量写入 Qdrant
  7. 更新文档和 job 状态

Inspect 的作用

  • chunking_preview:提前验证切块策略
  • vector_health:检查 source 在 Qdrant 中的 live 向量状态

Inspect 的价值是把“切块问题”和“索引问题”分开诊断,避免盲目重建。