汉语量词大词典

这个html假如先给词头加了标注,然后用老马的textforever除去html标签,也许能弄。

用什么做的?也说一说。

就是Abbyy FineReader

词头标注是很明显的name=“bookmark数字”

没用的,乱码。

用的私有字,自行比较替换就好了。

abbyy也不太好使,目前最先进的应该是 BuildVu,感觉是最还原的,同时可以导出woff字体方便对照私有字。
汉语量词大词典_13429638.pdf (idrsolutions.com)

汉语量词大词典.zip (7.1 MB)
以上网站导出的。

其实直接用私有字不替换也完全可以的。

数据不好,不好弄,失去兴致了。

我手上已经有的词典也太多了,不要再添一本了。 :smile:

看有没有人想弄。

1 Like

不弄,有图片版就行。

正文.zip (322.7 KB)
半成品的源文件,有意者继续完善吧。

4 Likes

乱码是这些吧。

犫	b
犮	c
犱	d
犲	e
犳	f
犵	g
犺	h
犻	i
犼	j
犽	k
犾	l
犿	m
狀	n
狅	o
狆	p
狇	q
狉	r
狊	s
狋	t
狌	u
狑	w
狓	x
狔	y
狕	z
爟	ṇ

还有序号都成 ?

用27楼转换的html查看乱码的class,然后在上面的css中查看对应的字体

对,这个是最麻烦的。我已经复原了,琢磨了不少时间,应该不会有错的吧,哈哈。

只是字体太多,没打开看,猜想DIY字体应该可以合并,编码不会冲突。
不行,冲突……

foxit最新版可以网上免费下载。

大佬,能发个buildvu的试用版吗?我在官网填的gmail邮箱提示说不支持

楼主你好,这个文件后来做成了mdx检索版了么?可否分享一下,谢谢

参看:

汉语量词词典

大词典-电子书