这个html假如先给词头加了标注,然后用老马的textforever除去html标签,也许能弄。
用什么做的?也说一说。
这个html假如先给词头加了标注,然后用老马的textforever除去html标签,也许能弄。
用什么做的?也说一说。
就是Abbyy FineReader
词头标注是很明显的name=“bookmark数字”
没用的,乱码。
用的私有字,自行比较替换就好了。
abbyy也不太好使,目前最先进的应该是 BuildVu,感觉是最还原的,同时可以导出woff字体方便对照私有字。
汉语量词大词典_13429638.pdf (idrsolutions.com)
汉语量词大词典.zip (7.1 MB)
以上网站导出的。
其实直接用私有字不替换也完全可以的。
数据不好,不好弄,失去兴致了。
我手上已经有的词典也太多了,不要再添一本了。
看有没有人想弄。
不弄,有图片版就行。
正文.zip (322.7 KB)
半成品的源文件,有意者继续完善吧。
乱码是这些吧。
犫 b
犮 c
犱 d
犲 e
犳 f
犵 g
犺 h
犻 i
犼 j
犽 k
犾 l
犿 m
狀 n
狅 o
狆 p
狇 q
狉 r
狊 s
狋 t
狌 u
狑 w
狓 x
狔 y
狕 z
爟 ṇ
还有序号都成 ?
用27楼转换的html查看乱码的class,然后在上面的css中查看对应的字体
对,这个是最麻烦的。我已经复原了,琢磨了不少时间,应该不会有错的吧,哈哈。
只是字体太多,没打开看,猜想DIY字体应该可以合并,编码不会冲突。
不行,冲突……
foxit最新版可以网上免费下载。
大佬,能发个buildvu的试用版吗?我在官网填的gmail邮箱提示说不支持
楼主你好,这个文件后来做成了mdx检索版了么?可否分享一下,谢谢
参看: