LLAMAINDEX面试

  1. 基础 RAG 流程(VectorStoreIndex → Retriever → Synthesizer)
  2. 过滤器体系(metadata、相似度、关键词、时间、LLM 重排)
  3. 多路召回与融合(QueryFusionRetriever)
  4. 混合检索(向量 + 关键词)
  5. 节点后处理链(Postprocessor 顺序、扩上下文、引用来源)
  6. 模板与占位符、输出解析、结构化引用
  7. 模型角色划分(embedding vs LLM)与 Ollama 本地部署
  8. 元数据治理(文件名、时间、部门、密级)

→ 这 8 大块基本覆盖了 90 % 的 LlamaIndex 面试题:

  • “召回阶段有哪些Retriever?”
  • “过滤器执行顺序?”
  • “LLM 重排原理?”
  • “怎么给答案加引用?”
  • “向量与关键词如何混合?”
  • “metadata 缺失怎么办?”

所以确实够应付一轮中级/高级面试;真要被问到更深,一般就两条延伸:

  1. 源码级IndexStoreVectorStore 自定义实现,NodeParser 嵌套,异步 aretrieve 流程;
  2. 生产级:分布式索引、增量更新、多租户权限、量化部署、重排模型微调。

发表回复