求助:拉Mineru源码后打包成docker镜像,部署到linux服务器上的OCR效果比在windows系统上直接运行Mineru源码要差 #4829
Replies: 2 comments 2 replies
-
|
@Wxx1250227780 这个问题很可能是由于 hybrid-auto-engine 模式在处理日语文档时的 VLM OCR 不会被启用 导致的。 核心原因:在 你在 Windows 上直接运行时,可能使用了不同的后端配置或模型加载方式,导致两边效果不一致。另外,维护者也提到过近期版本 VLM 模型对日语的支持可能变差了 [3]。 建议尝试以下方案:
如果你主要处理日语文档,也可以尝试显式使用 To reply, just mention @dosu. Docs are dead. Just use Dosu. |
Beta Was this translation helpful? Give feedback.
-
|
你要不试试用官方提供的dockerfile 和compose呢? |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
dockerfile.txt
docker-entrypoint.sh
docker run -d --gpus all --name mineru-api -p 8002:8002 -v /home/drdp/mineru-models/pipeline/PDF-Extract-Kit-1:/models/pipeline -v /home/drdp/mineru-models/vlm/MinerU25-Pro:/models/vlm mineru:3.1.0
mineru -p C:\Users\wxx\Desktop\黄銅及び黄銅材の製造方法、製造設備.pdf -o C:\Users\wxx\Desktop\mineru-ocr -b hybrid-auto-engine -l japan --api-url [linux服务器IP|本地IP]
6.windows系统运行结果
Beta Was this translation helpful? Give feedback.
All reactions