作者归档:admin

PDF扫描文件加入RAG

1 PDF分页为PNG输出 pdf2image 2调用OCR程序 ,可以使用ol … 继续阅读

发表在 None | 留下评论

RAG原理

MVP 小规模 1万文档SQlite 存储node信息,查询后实时BM25再关键 … 继续阅读

发表在 None | 留下评论

文档表 node信息json字段保存,metadata信息JSON保存

SQLITE查询载入node信息 根据metadata查询并返回node信息

发表在 None | 留下评论

llamaindex节点 存储JSON 载入 增删

调用示例: 如果数据库记录doc_id对应的node_id那么可以 至此: 全盘 … 继续阅读

发表在 None | 留下评论

llamaindex BM25 新建 添加 重建(使用json存储nodes节点信息)

发表在 None | 留下评论