[改版] 现代汉语大词典(图文综合版)6.27 更新

是说这个打包软件,还是说我打包的词典?
您平时用哪一版呢?

6.5 这版,现代汉语大词典,有56个不正常的词头,会出现跨词条的情况。
不清楚是打包软件的原因还是词典的原因。MDict显示正常可能是做了特殊处理,毕竟没开源,哪位有欧路可以看看是怎么显示的?

“XHDCD1767”
“䲣”
“下课”
“串鼻子”
“交罗”
“伤暑”
“假托”
“兴造”
“出门子”
“劳苦功高”
“压电传感器”
“吃夹档”
“和番”
“噶嗒”
“埋”
“大餐”
“威棱”
“容人”
“屏1”
“平静”
“录音”
“恭谨”
“房长”
“抱腰”
“排货”
“放荒”
“无毒不丈夫”
“月份牌”
“枣椰”
“樟”
“水壶”
“泼剌”
“清水脸”
“灵妙”
“物议”
“生态环境”
“白纸”
“瞎说乱道”
“祸乱”
“笔杆”
“纬”
“羞臊”
“胡笳”
“芭蕉扇”
“蒲茸”
“补花”
“讹言”
“豪勇”
“越礼”
“辍”
“透雨”
“镊”
“随机存贮器”
“顺随”
“驯静”
“麻经”

2 Likes

安卓欧路显示正常

这些词头是怎么找出来的呢

1 Like

那说明欧路也做了特殊处理,GD也需要做下。mdx出错,因为是文本可以自己分割,如果是mdd出错就修不了了,不过用户也感知不太到。 :smile:

我这边跑代码看的。

iOS欧路显示正常

2 Likes

那完了,学不会了 :joy:

词头:赵
给了个趟水过的趟

哦iOS 欧路(

1 Like

将 测试.zip里的现代汉语大词典(图文综合版).1.mdd放在eudb_en文件夹下,欧路词典确实显示公式了,mdx用的是6月5日的

1 Like

赵的繁体字确实错了

1 Like

原因如 @last_idol 说的一样。


mdx中的词头在很多词头块中。出问题的应该都是块中的最后一个词。胡笳(原则上是最后一个词),块长度有问题,包含了下一个块中的一部分词条。

应该是制作工具的问题。

正确的长度应该用 下一个块的开始偏移-胡笳的开始偏移

gd原版可以正常显示,是因为使用的是 string()方法,默认只取了 \0 之前的字符串部分。结果显示正确。

string()方法之前被我修改过,目前已经先还原了。

最新版应该可以正常显示了。

更进一步的方法是解析的时候,长度要修正,后续处理。(the last headword in the block has incorrect data length by xiaoyifang · Pull Request #106 · xiaoyifang/goldendict · GitHub)。

1 Like

感谢更新!新版显示正常了。原来不是我的问题 :sweat_smile:
我最开始打包的文件没这问题,所以可能是特定长度的词条会出问题?又或者以前的文件也有问题,只是没发现 :joy:

我刚才将5.8的文件解包再打包,查“胡笳”等显示没问题。后来又在虚拟机中打包,有问题的还是有问题。

原以为原版打包软件兼容性更好呢……

1 Like

还需要判断两个词头,就是胡笳和下一个词头,对应的record是否在同一个record压缩块里,只有在同一个压缩块,才需要这么处理,如果对应的record在不同的压缩块,之前计算的长度是正常的。

Pull Request #163,第620行的reachedEnd是判断在同一个压缩块吗?

应该跨压缩块了。reachEnd应该叫readNextBlock

@last_idol@xiaoyifang 兄,有兴趣研究下5.8的文件是否有不正常的词头吗 :grin:
现代汉语大词典.rar (15.3 MB)

“XHDCD1767”
“一个劲”
“不三不四”
“临机制胜”
“交颈”
“伪善”
“偎窝子”
“兵灾”
“函授教育”
“勇壮”
“厌苦”
“吃白相饭”
“咏赞”
“嚣然”
“城防”
“天主堂”
“娇媚”
“宽怀大度”
“展演”
“年景”
“形而上学”
“恶3”
“扁额”
“抹灰”
“探寻”
“政协”
“无稽”
“月芽”
“枭笑”
“横强”
“水木清华”
“洊”
“清素”
“灵通”
“牵缠”
“生民涂炭”
“白金”
“瞩”
“禁子”
“笤帚”
“纱罗”
“群蚁溃堤”
“胯”
“花好月圆”
“蒿草”
“表格”
“论赞”
“豪阔”
“趟地”
“输尿管”
“里虑”
“镖”
“隐名埋姓”
“须弥世界”
“驰骤”
“麻纺”

2 Likes

刚才搞错了,还以为没问题。
这样看来,这个原版打包软件确实会出问题啊。

自從我棄用 mdxbuilder,改用 MDict.exe 打包,就沒有 index 方面的怪問題。

MDict.exe 另外好處是可以用 batch file 運行,信息不用重新輸入,方便多了。

另外,MDict.exe 可以把不同 txt 文件併成一個 mdx,所以複雜的字典可以把不同層次分開。編輯時更方便,體積也分散了,所以在 emeditor 會更順。
而且使用正則時,等於有隔離的作用。

是时候学习新的技术了 :grin:

您是指:mdict-utils ?

1 Like

是的。。。。

4 Likes

感谢分享改版。越来越好使。

2 Likes