Replies: 1 comment
-
|
@ojslee 根据代码分析,MinerU 对 DOCX/PPTX 的处理和可视化对比的实现如下: MinerU 并不会将 DOCX/PPTX 转成 PDF 来抽取,而是使用原生库直接解析:DOCX 用 python-docx + mammoth,PPTX 用 pypptx-with-oxml [1]。抽取后会统一输出标准化 JSON 格式,bbox 坐标归一化到 0-1000 范围。 关于你提到的官网上左右对比画框定位的功能:MinerU 代码中的 bbox 可视化叠加系统( 不过,官网在线 Demo 包含了一些额外的渲染后处理优化,这些优化是专门用于预览展示的,并不包含在核心开源代码中 [3]。所以官网上看到的 DOCX/PPTX 左右对比画框定位功能,很可能是在线 Demo 额外实现的前端渲染逻辑(例如将文档临时转为 PDF 用于预览展示,或通过前端坐标映射实现高亮),并非开源版本自带的功能。 简单总结:
To reply, just mention @dosu. Share context across your team and agents. Try Dosu. |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
官网网址上docx,pptx抽取完之后,能够左右对比定位是如何实现的?
miner3 原生支持docx,pptx抽取,但是并未发挥bbox的坐标,但是页面上支持画框定位,是因为都转成了pdf了吗?
Beta Was this translation helpful? Give feedback.
All reactions