- 基础 RAG 流程(VectorStoreIndex → Retriever → Synthesizer)
- 过滤器体系(metadata、相似度、关键词、时间、LLM 重排)
- 多路召回与融合(QueryFusionRetriever)
- 混合检索(向量 + 关键词)
- 节点后处理链(Postprocessor 顺序、扩上下文、引用来源)
- 模板与占位符、输出解析、结构化引用
- 模型角色划分(embedding vs LLM)与 Ollama 本地部署
- 元数据治理(文件名、时间、部门、密级)
→ 这 8 大块基本覆盖了 90 % 的 LlamaIndex 面试题:
- “召回阶段有哪些Retriever?”
- “过滤器执行顺序?”
- “LLM 重排原理?”
- “怎么给答案加引用?”
- “向量与关键词如何混合?”
- “metadata 缺失怎么办?”
所以确实够应付一轮中级/高级面试;真要被问到更深,一般就两条延伸:
- 源码级:
IndexStore、VectorStore自定义实现,NodeParser嵌套,异步aretrieve流程; - 生产级:分布式索引、增量更新、多租户权限、量化部署、重排模型微调。