Pdf词典文件,ocr输出文本制作mdx

请教:有部汉英词典pdf文件,经ocr后,输出了word和txr文档,然后如何制作mdx呢。用其他汉英的词头,如何去粗略匹配和制作啊,不懂这个技术啊。

1 个赞

没有啊。不懂其他技术啊。

这种ocr的可信度很不可靠。mdx格式汉英词典有很多现成的产品,使用就是了。

有也为王,权当参考。对词典等本来也是应吃学习批判态度,所谓尽信书不如无书。

粗略匹配是用于图片版词典的,而非文字版。

1 个赞