汉语量词大词典

看了一下文字版pdf,发现无法完美复制文字,除非做ocr。

假如做ocr,因为词头没有【】括号,还很难分出词头。

旧版的foxit无法处理。假如有人有最新的foxit,可以试一下能否导出文本。

cajviewer导出,完全不行。

贴个简介。

《百度百科》
汉语量词大词典
《汉语量词大词典》收录量词1080多个(多音多义词分别计算),基本囊括了古代汉语和现代汉语中常见习用的专用量词、兼用量词和特点突出、公认度较高的借用量词。全书按汉语拼音音序排列,同音字按笔画、笔顺为序。词目用汉语拼音字母标注普通话读音。 个别需要注明方言音的,另在【申说】中说明。

这个pdf不过几百页,不大。

假如有人有兴趣试用合合,不妨拿合合做ocr看看。

合合TextIn文档解析工具内测

词头旁边有[拼音],假如能准确辨识,利用 [拼音],就可以弄出词头。

finereader辨识拼音不行。用finereader干,结果可能不好。