OCR模型的平台

识别对接旧平台

大模型OCR 后直接导出对应的格式 如JSON 然后再用requests 发送请求将其信息与图片传回到原有的平台实现对接 : 原平台对接功能,实现识别发生功能

可以对prompt编辑和导出默认格式 format=‘json’


PDF拆分为图片模块

默认OCR后信息(可以显示内容及摘要)
可以直接归档到LLAMAINDEX RAG【或者采取审核模式】


0.1.0版本的功能 不集成RAG功能:

  • 自定义选择ollama的地址
  • 自定义选择VL模型
  • 选择format格式
  • prompt内容设置
  • requests请求地址设置
  • 请求内容 即处理导出的内容 和 auth信息验证
  • 历史功能 即1.识别的信息2.提交后请求状态
  • 成功及错误列表 对历史功能的筛选。
  • 重新发起识别 ocr
  • 重新发起请求的功能 requests

发表回复