大模型做OCR不如直接OCR

发表于2025年7月29日由admin

用Qwen2.5VL 3b和7b做OCR 效果不行，不如直接使用OCR的包，如CnOcr

安装：

pip install cnocr[ort-cpu]

pip install cnocr[ort-cpu] -i https://pypi.tuna.tsinghua.edu.cn/simple

首次安装会去hf上下几个模型，CPU也可以运行，效果不错：

from cnocr import CnOcr

img_fp = 'page_10.png'
ocr = CnOcr()  # 所有参数都使用默认值
out = ocr.ocr(img_fp)

print(out)

返回结果为文本信息准确率位置信息

文档：https://cnocr.readthedocs.io/zh-cn/stable/

解决方向：OCR 结果给大模型处理

此条目发表在None分类目录。将固定链接加入收藏夹。

要发表评论，您必须先登录。