如何制作文字版辞典

我再去看了一下说明,我想我的记忆错了。我说的大概是我想做的实验,放弃没做,还以为可以。

普通的网页可以连接到电脑内文件,甚至可以通过脚本编辑。至少过去是可以的,我试过,这种网页叫hta。新的系统还行不行,就不知道。

mdx可以连接到外部网站的网页,但是似乎不能直接连接到电脑内的文本。假如通过脚本调用外部程序,当然是可以的。至少我知道:Wfg的mdx是可以通过脚本,打开外部的pdf,还跳到某一页的。

有兴趣可以研究wfg的《本草纲目》mdx

那么,ocr的内容能不能弄到mdx里来?要先处理过,每一页处理成一条。这不会太困难——假如不要求好看。ocr文本通常很丑。