Skip to content

changdazhou/PaddleXLabel

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

文档解析类标注工具

该标注工具是用于解析文档并生成标注信息的工具。支持PP-StructureV3产线的输出结果作为预标注,目前已支持版面顺序标注、表格标注和公式标注,更多标注类型正在开发中。

安装

该工具基于Python开发,请确保已安装Python 3.10或更高版本,并安装requirments.txt中的依赖。

pip install -r requirements.txt

运行

在运行前,需要修改PaddleXLabel/app/routes.py中IMGAREA_FOLDER和PRE_LABEL_FOLDER的路径,更换为待标注图片文件夹路径和预标注文件夹路径。

python run.py

排序标注

在左侧标注界面选择标注框,在右侧列表中更新顺序ID即可调整标注框顺序,其他框会自动更新。

待标注框为蓝色,页眉页脚标注框为黄色,连接前段标注框为绿色。

按回车键提交结果并落盘到标注文件中。

公式标注

公式标注必须标明公式类型,否则无法提交。

待标注框为蓝色,选中框为红色,已标注框为绿色。

按回车键选择下一个待标注框,整个页面公式均标注完成方可提交落盘,否则会提示错误。

表格标注

表格标注必须标明表格相关属性,否则无法提交。

待标注框为蓝色,选中框为红色,已标注框为绿色。

按回车键选择下一个待标注框,整个页面表格均标注完成方可提交落盘,否则会提示错误。

About

A Label tools by PaddleX

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors