阿弥陀佛
1
2020.5.1更新,排序,刪除重複的解釋。增加2.0光盤的說明註腳。
本版漢語大詞典,綜合了漢語詞典3.0光盤版、漢語詞典2.0光盤版、漢語大詞典訂補一、二的內容,並修正了不少文字、標點差錯,優化排版而成。應該是目前較好的版本。
3.0光盤詞條382166,比2.0版居然少了許多詞條。從2.0中補了1.6萬條。
增補後的詞條432506
2.0版號稱有60萬,實際上沒有那麼多,簡繁、異體跳轉的有20多萬。有許多重複詞條。
雖然花了巨量時間製作,但問題肯定是存在的,先這樣吧。
CSS內置在MDD中,原文件也一並上傳。有能力的可自己去修改。
3.0版本有一些文字錯誤,比如:浮生六記,作者“沈復”都寫成了“沈覆”,“芸”寫成了“蕓”,已修正。
链接: https://pan.baidu.com/s/1cek7C_8o8loEMM0Obb0P7Q 提取码: ajn8
15 个赞
阿弥陀佛,真是惊人啊。发布的词典数量和速度无人能及啊,感谢你无私慷慨的分享。
2 个赞
多谢!《汉大》是我最常用的词书。前些年对照各种版本做过些整理,佛君的修订整合又是一个重要参考。因为还没有看,先有几点请教:
1 不知对我此前发的《订补》出现的问题做过修正吗?
2 各义项前的黑底数字,是如何转换的?能不能还与数字对应,便于正则处理?因为《汉大》义项太多,我习惯于隐藏例证,需要看哪个再点击展开。
3 光盘3的词头和释义默认都是繁体,还是佛君转换的?
下载后粗粗看了一下
1 《订补》没有修订
2 黑圈数字应该用的原数据
3 建议既然合并,带词条也合并了
4 光盘2和光盘3最好也和《订补》一样,注明来源
5 光盘2对一字多音有数字标号,最好保留。因为词条没有注音
解决一下排序问题。
链接: 百度网盘-链接不存在 提取码: suw8
1 个赞
阿弥陀佛
16
1 不知对我此前发的《订补》出现的问题做过修正吗?
沒有。你可研究下改。
2 各义项前的黑底数字,是如何转换的?能不能还与数字对应,便于正则处理?因为《汉大》义项太多,我习惯于隐藏例证,需要看哪个再点击展开。
樣式表中有。
3 光盘3的词头和释义默认都是繁体,还是佛君转换的?
光盘3本來是繁體的。
光盘2对一字多音有数字标号,最好保留。因为词条没有注音
原數據沒有加數字 。
用mdict-util导出为sqlite,然后再转成csv,最后用emeditor全选排序
1 个赞
阿弥陀佛
18
感謝完善。教育部成語典的排序也是自動的,若有意您也可完善下。這個我不會。
多谢!但没明白所说的排序指什么?是指索引的顺序吗?看了一下“沈”条的释义排序,序号是对的。
不过另外有发现,“沈”条上标2与其中不带上标的数据有重复,估计这类情况不少。