该标注工具是用于解析文档并生成标注信息的工具。支持PP-StructureV3产线的输出结果作为预标注,目前已支持版面顺序标注、表格标注和公式标注,更多标注类型正在开发中。
该工具基于Python开发,请确保已安装Python 3.10或更高版本,并安装requirments.txt中的依赖。
pip install -r requirements.txt在运行前,需要修改PaddleXLabel/app/routes.py中IMGAREA_FOLDER和PRE_LABEL_FOLDER的路径,更换为待标注图片文件夹路径和预标注文件夹路径。
python run.py在左侧标注界面选择标注框,在右侧列表中更新顺序ID即可调整标注框顺序,其他框会自动更新。
待标注框为蓝色,页眉页脚标注框为黄色,连接前段标注框为绿色。
按回车键提交结果并落盘到标注文件中。
公式标注必须标明公式类型,否则无法提交。
待标注框为蓝色,选中框为红色,已标注框为绿色。
按回车键选择下一个待标注框,整个页面公式均标注完成方可提交落盘,否则会提示错误。
表格标注必须标明表格相关属性,否则无法提交。
待标注框为蓝色,选中框为红色,已标注框为绿色。
按回车键选择下一个待标注框,整个页面表格均标注完成方可提交落盘,否则会提示错误。