LlamaIndex 框架指南
LlamaIndex 是专注于数据索引和检索的 LLM 框架,特别适合构建 RAG (检索增强生成) 应用。它是连接你的私有数据与 LLM 的最强桥梁。
如果把 LLM 比作“很会说话但记性一般的同事”,LlamaIndex 就像“会做档案管理的项目助理”。
它不负责替你思考业务,但能在你提问时把最相关资料准确递上来。
#核心能力
- LlamaHub:提供数百个数据连接器,支持 PDF、Notion、Discord、SQL 等。
- 先进的索引:支持向量、摘要、树状、知识图谱等多种数据组织方式。
- 专业的 RAG 链路:内置重排序 (Reranking)、子问题查询等高阶检索策略。
#学习路径
#适用场景
- 多来源非结构化文档检索(PDF、网页、知识库、会议纪要)
- 对召回质量要求高的企业问答系统
- 需要可控检索流程(重写查询、重排序、路由检索)的项目
#面向读者的落地路线
- 初学者:先做单文档问答,确认端到端流程
- 有经验开发者:引入多数据源与 metadata filter
- 团队项目:建立评估集 + 版本化索引流程,避免“每次上线都像抽奖”
#项目落地建议
- 先明确数据边界:哪些文档可以进入索引,哪些必须排除
- 建立基础评估:命中率、答案可引用率、幻觉率
- 分层优化:先优化切块,再优化检索,再优化生成
#常见问题
- 为什么召回不准? 往往是切块过大或元数据不完整,而不只是模型问题。
- 为什么成本变高? 重复索引和过高 Top-K 是常见原因,先做采样评估再放量。
一句话类比:
检索系统像点外卖,不是“点得越多越好”,而是“点对菜、准时送到、别送重样”。
提示:如果您处理的是非结构化文档(如 PDF 或长文本),LlamaIndex 通常是比 LangChain 更专业的选择。