求助一下, 这本《现代汉语词典(2002增补本)(汉英双语)》 词典词条里面有好多字只显示一个

嗯,他做的词典都是卖的,只有一两个小型作品免费。

这本词典的数据来源是哪?

1 个赞

9.5m那个是h105做的,8.7m不知道谁做的。
9.5m词条里多了词组,8.7m没有,这个词组我觉得是h105用程序生成的。
9.5m词条样式漂亮,8.7m样式非常简单。
9.5m词条源码里删掉了很多信息,8.7m的源码里都保留着。
9.5m词条数62059,8.7m词条数62485。
9.5m里包含私有区的词条都删掉了,8.7m私有区词条不可查询。

1 个赞

用程式增加的词组没什么特别用处。

没有一点版本学素养、爱乱删源数据的人做的版本,我是不敢用的。数据毁坏了,样式再漂亮也没用。

8mb版确实没有以下这两个词。大概掉了。
啰嗦 [luō·suō]
同“啰唆”。
啰唆

所以9mb版也许补了一些词头。真要整理的话,需要比对一下。

真要整理,其实还是得对照图像版。

1 个赞

再看了一下,其实是有的,不过因为是私用区字,所以检索不到。

唆
也作嗦

1 个赞

解包看了啰嗦确实有!之前看漏了。

对了一条。

8mb版
也作 also
这个和原书一致。

9mb版
也作 also put as

“也作”怎么译成了also put as“”?!

这样乱改词典,令人发指,毛骨悚然啊!

有750个词头带ㄦ字,要不要去掉?这个是拼音字符,正常无法搜索的,或者ㄦ替换成儿?
比如冰棍ㄦ,冲劲ㄦ,准ㄦ,几ㄦ。这种词头要如何处理好?

这个“ㄦ(U+3126)”确实很古怪,不知道为何在我的资料库里无法检索。

当然替换为“儿”字。

词头要不要放“儿”字,看原书。

另外,可以考虑和其他《现汉》的重要电子版一致。

《现汉7》商务印书馆的app,在文本里保持ㄦ字,但搜索时需要使用儿,才能检索到,感觉不是很合理,南方人不发儿话音,应该再增加一个去掉儿字的词头。

1 个赞

原书用小字号的儿:

1 个赞

感谢你们的讨论,受益匪浅!

9mb版,是被阉割和污染过的版本,从版本学上看毫无价值,比明本还糟糕。这个“also put as”,什么英文水平?!也敢乱改词典!!!

要改只能改8mb版,但是得花大力气改。是否值得???

8mb压缩档版比9mb版齐全,但也只有62485条。

做图像索引版也许更值得。

能找到chigre3这个切图版最好。

chigre3: 现代汉语词典(汉英双语)2002年增补本 切图版
0001-2580: 共计62623 (包含拼音1334, 单字10782, 词语50507)
2581-2645: 共计1205 (新词新义)
2646-2649: 共计142 (西文字母开头的词语)2019.03.08: 49个插图和表格
https://061061.xyz/32394.html

单字10782+词语50507=61289
2581-2645: 共计1205 (新词新义)
合计:62494
2646-2649: 共计142 (西文字母开头的词语)
合计:62636

K大这个百度盘的pdf,我希望有人传到libgen去。
【高清PDF】现代汉语词典(汉英双语版)
https://061061.xyz/35896.html

K大:【高清PDF】现代汉语词典(汉英双语版)
链接:百度网盘 请输入提取码
提取码:r4iz

chigre3版估计很难找,假如能得到词头索引,再用K大的高清pdf重制图像,就可以重做一个图像索引整页版。那仍然是可靠的。

是否可以用《现代汉语词典》来制作汉英双语版的图片词典呢?

可以,不过这书翻译其实一般,不值得做。
现代汉语词典2002年增补本没有文字版。最接近是第五版,第五版数据一般,而且和2002版差别很大。只能做个很粗略的匹配。

据说翻译是北外《汉英词典》的团队

现代汉语词典好像是有双语版的app, 万有知典出的,商务印书馆的子公司。看过别人发截图,但没有看到实际内容,不确定是不是第7版的。9.5m的被改坏了,8.7m的数据很完整,应该是app提取的,不知道作者是谁。

这个汉英双语版是《现汉》第2版增补本,增补的部分后来进了《现汉》第5版。

没有《现汉》第7版的双语版。

这个mdx也许对app提取完整了,但app到底用了图像版多少内容,就不得而知。即使词头数目接近,内容肯定是有删减的。

其中的一部分翻译与《现代汉英词典》相同。《现代汉英词典》本来就参考了《现代汉语词典》,不过没有全译。纸版的《现代汉语词典》双语版是全译(包括丰富的短语),价值在这里。

app版要是偷工减料太多,整理基于app的mdx,做那么多苦工,得不偿失,就很郁闷。

图像索引版的价值在于可靠(自作聪明的人无法乱改),而且资料完整。

《新世纪汉英》的文本版很好用,但内容其实也删减了。我还希望有个图像索引版。

1 个赞

网上有一个2.43G的PDF,可以用来制作图像索引版。

很早之前就看到是新华字典的。。。不可能来自app吧。
其实各种各样的词典在21世纪早年杂七杂八的电子辞典都登陆过,那个年代电商平台也不发达,来源很难得知。
hanyl05很擅长电子辞典数据提取,好几本作品应该都是电子辞典来的。

商务印书馆的工具书数据库从来不收双语的这两本,不知道为什么。
https://bjzs.vdict.com.cn/产品介绍及使用帮助/产品介绍.html
http://www.icidian.com.cn/cpnet/product.aspx

1 个赞