求第一列是什么字

demo · 2025 年5 月 10 日 10:20

OCR识别模型关注的重点是这一堆像素点排列组合对应一个具体文字的概率，通常也只对参与训练过的文字字形识别正确率高，没参与过的就低。至于这个文字是英文字母、数字、emoji表情、简体字、繁体字、异体字，或是这个文字是宋体、楷体、隶书、甲骨文什么的它完全不关心，这是人赋予的语义符号。以15楼那些错误文字为例，标注为错误文字后，下次合成训练数据时忽略这些文字，训练模型的时候模型没见过这个错误对应关系，将它们对应起来的概率就低。通俗来说，训练模型就像学生学认字，看正确字形次数越多，下次看到差不多样子的文字正确认出来的概率就越高。