自己用 Python Pyside6 写的小工具截图。过年闲着无聊用网上找的字体合成训练数据,训练中文OCR模型玩,再用训练出的模型输出识别错误的文字,最后在开发的工具批量将这些文字可视化出来。
以下是工具完整截图,界面大概说明:
选择主字体是指选择一个作为参考的目标字体,左上角的大号字是当前选择的识别错误文字在参考字体的字形,左下列表是识别错误的文字列表。
第一列文本内容:当前选择的错误文字在第五列那个字体中的字形
第二列预测-源:当前选择的错误文字被模型识别出的文字在第五列那个字体中的字形
第三列预-主:当前选择的错误文字被模型识别出的文字在参考字体中的字形
第四缺失:用于训练的那张图片中有哪些文字识别错误,以参考字体字形显示
第五列字体:用于合成训练图片的字体名
