OCR MinerU2.5

#UV


python -m pip install -U pip uv -i https://mirrors.aliyun.com/pypi/simple
uv pip install -U "mineru[core]" -i https://mirrors.aliyun.com/pypi/simple


#---



pip install -U "mineru[core]" -i https://mirrors.aliyun.com/pypi/simple

# 3. 下载模型权重(国内镜像)
 三种方法
export MINERU_MODEL_SOURCE=modelscope
#linux


$Env:MINERU_MODEL_SOURCE = "modelscope"
#windows powershell

set MINERU_MODEL_SOURCE=modelscope
#windows CMD

mineru-models-download        # 首次运行会自动生成 ~/mineru.json 配置
#会让你选择下载源 modelscope
#选择下载类型 all


# 查看版本
mineru --version
# 示例:mineru 0.9.2

# 跑一张 CPU 单线程测试
mineru -p sample.pdf -o out_dir

#out_dir下有一个 sample.md文件  可以给LLM识别 
#文本识别模型可以使用! qwen3 也可以

发表回复