汉语成语源流大辞典 修订版

问题记录,方便 ocr 做词典时校正:

  1. 标点符号识别缺失。如【、句号。
  2. 段落(即“\n”的判断)有误。有时缺、有时多。可能是按语义来判断的?
  3. 标点符号识别
    1. 错码:全角[半角[混用
    2. 错误:竖线符号 | 识别为括号「
  4. 拼音的声调无法识别,只能识别出字母。
3 个赞