现在有了新版校对工具,之前很多比较麻烦的大型词典也比较容易处理了。用gemini,quark和paddleocr分别识别了3个版本,可以直接导入校对工具使用,paddleocr的数据是带文本位置的原始数据。
设置如图:
pdf是这个版本:
COECD_gemini.txt (16.6 MB)
COECD_quark.txt (15.9 MB)
COECD_paddleocr.7z (15.6 MB)
Concise Oxford English-Chinese.docx (15.2 MB)
app的词头数据:
oxford_concisedict.dict.zip (7.4 MB)

