汉语大词典光盘版2.0,另附3.0光盤版

汉语大词典光盘版2.0

《汉语大词典》是我国最大的一部汉语辞典,它所涉及的知识面极为广泛,与社会生活、古今习俗、中外文化乃至各种宗教教义,都发生纵向或横向联系。其内容之浩繁、考订源渊之深远,实为一部大型的、历史性的汉语语文辞典。这部巨著历经十余年,国内数百位专家参与了这项艰巨的编写工作。全书十二卷,共收词目约三十七万条,五千余万字。
汉语大词典2.0版光碟集现代电脑软件技术之大成,将十二卷《汉语大词典》印刷本中的绝大部分字、词及其释义和关联等信息浓缩于一张光碟上。光碟版在印刷版本的基础上,扩充了大量电子信息,大大丰富了原书的信息量。汉语大词典2.0版共收入汉字20902个,复词343307条,成语23649条,释义515524项,新增例证877130条。在查阅手段上很好地解决了传统方式查找字或词时繁琐且效率低的弊病,可以说光碟版集各种结构化的电子信息和查询方法于一体。这张光碟采用了先进的超文本数据库结构,标记出字和词的形、音、义复杂的逻辑关系,采用导航式查询方式、多方式查询入口,超文本自动跳转查询等手段,方便快捷。光碟版有强大的多媒体功能,每个汉字均可发声,包括多音字,还收入了519幅黑白图片。由于本光碟是基于Windows95/98/NT/2000/XP中文版开发的,为了保证本光碟与Windows95/98/NT/2000/XP中文版字符集GBK(Code Page)的兼容性,所以收入的汉字字头少于印刷本。


电脑上存了多种版本的汉语大词典,偶然翻出了这一版。大家看看怎么样
汉语大词典的编辑们当时怎么想的,弄出这一奇葩的格式:释义用简体,引证用繁体,不怕麻烦么?
汉语大字典也是这样,奇葩的格式让人无语!
不如辞源,全用繁体,多好啊!

本版特点:繁简格式与纸书基本一致。还多了拼音。整合了订补的内容。有插图。

请看:
纸书VS光盘版2.0

03A


插图


下载:
漢語大詞典2.0.part1.rar (39 MB)
漢語大詞典2.0.part2.rar (39 MB)
漢語大詞典2.0.part3.rar (23.8 MB)

附3.0光盤版,原始數據,沒有後期修改
漢語大詞典光盤版3.0.part2.rar (39 MB)
漢語大詞典光盤版3.0.part3.rar (4.5 MB)
漢語大詞典光盤版3.0.part1.rar (39 MB)

增加简体检索
漢語大詞典光盤版3.0增加简体检索版.part2.rar (39 MB)
漢語大詞典光盤版3.0增加简体检索版.part3.rar (6.7 MB)
漢語大詞典光盤版3.0增加简体检索版.part1.rar (39 MB)

16 Likes

好东西,先下载为敬

链接无法下载。

还好不是全部简体。原文是繁体,就可以用。
谢谢分享

我下载完了,都可以解压。

换个时间下载,用下载软件,例如本坛书友介绍的Fdm:

FDM 6.14.2 for Windows 10/8.1/8/7
Free Download Manager
https://www.freedownloadmanager.org/download.htm

这个格式理所当然的呀,古今兼收、尊重原文、大陆词典,里面引用的现代文可都是简体,那释义用繁体的话,作为大陆的最权威的语言词典,未免有点不合适 :rofl:
十分感谢分享!3.0的繁体也是机器转换,3.0的原文里就有转换错误,可以说2.0的文件是最严谨的了。

2 Likes

3.0繁体版相比这个2.0的简体版少了很多内容,不止是词头少了,书证都少了很多,论坛上有阿弥陀佛的合并版,应该是在3.0版的基础上添加的2.0版词头,或许现在在这个2.0版上添加3.0版的内容会更好,有兴趣可以查「讋伏」对比下。

1 Like

多谢楼主!这个所谓光盘版2.0是个神奇的存在:
1 附有较准确的纸书页码(但有些字如“㕋”、“㗉”没有),解包后发现应该源自tisank的图像版信息,但修正不少
2 有很多真正的光盘2和光盘3没有而纸书才有的条目或例证。比如7楼所说的3个例证,光盘2其实只有1个;再如“𠁁”条光盘2与光盘3都没有;“讌樂”条的下标……
3 订补也不是来自我转制的订补。如我发的订补“竈”,这里直接变成了简体“灶”,但在“竈下婢”条却保留繁体;订补也不全(看楼下的解包文件这个订补还是源自我的转制)
4 拼音显然是电脑自动注音的,完全无视多音字。比如“一分”有fen1和fen4;“一一行行”纸书上注明“行”读hang2等。
5 光盘中存在的一些问题它也存在。比如“八音匣”内容不全,“引”的义证错乱等

所以原以为出自tisank,但对比手头他的词典,那里有的条目这个版本反而没有,可能性不大(“魚【𥫗滬】”又使可能性陡增);但根据上述3、4、5条,也不可能是官方版本。最终推测,这是一位认真耐心的朋友,结合纸书补充不少内容。总之,价值很大,也有问题。

2 Likes

好东西!但也确实有些小问题。

比如
合并新加条目的时候,没有考虑到存在跳转的情况,结果产生如图问题:
屏幕截图 2021-08-23 233618
此类条目无法查询,差不多有500多条。

拼音标注的时候,考虑了按字项1、2等,但没有考虑到叠字的情况,如图:
屏幕截图 2021-08-23 234921

4 Likes

@sxingbai @notwind @abs 您可继续修正完善,造福大众

楼主已认可,希望出个修正版,接力打磨以趋完美哈。

您可不可以发下您做的订补内容,这个找了好久也没找到比较好的版本。

1 Like

昨天才又更新了下,但还有问题:
一是当初从pdf转换时造成了,发现了不少,但只更正了一些。尝试过重新转换,但无论如何也达不到当初的水平,只得作罢
二是添加标签时出现不少错误,昨天把原来的全部删了重新再来,但肯定还有问题。《汉大》内容太复杂了,总有想不到的情况。
因为还不满意,本来暂时不打算公开,既然老兄要,那就先放出来吧。
漢語大詞典訂補.mdx (4.6 MB)

2 Likes

谢谢啦。学习一下。

不像是自动注音的。如「裳」chánɡ,「暴發」pù fā 在2.0版本中的拼音都是正确的,尤其是后者pù fā不像是电脑能完成的。

感谢楼主分享,铭感拜谢。论坛高人云集,佳作频出,感佩!

下载了还无暇研究,看了sxingbai兄的评语,知道确实值得珍藏。这么大的书,根据图像版增补资料,还加插图,不仅工作量惊人,功力也莫测高深。

叠字和多音字的注音,大概可以根据《现代汉语词典》电子版修补;难词的注音,可以查《汉语大词典词目音序索引》。

依我个人的浅见,改进基于光盘3.0的mdict词典有如修订明本,枉费功夫。这个基于光盘2.0的mdict词典虽然不是宋本,但至少像元本,值得继续改进。

只不过《汉语大词典》实在太大,不止望而生畏,简直闻而生畏,可能只能局部订补,无法全面修订。

本坛有一个绝佳的图像版(《汉语大词典》三卷本,哇呀呀 - #36,来自 shaoshi),和这个文字版正好是天作之合,同时相聚,可谓天赐良缘。

在Golden Dict的content文件夹中再增加文件夹,例如:

01汉语大词典2.0
02汉语大词典图像版
03汉语大词典订补

文件夹内置放各版词典,在Golden Dict中就可以同时检索出来,对比研究。

1 Like

这是高级的自动注音技巧,分析了《汉语大词典》字头的注音,才根据字头1、字头2、字头3分别注音的。

我同意notwind的分析。

1 Like

@sxingbai

sxingbai兄这个版本包括了你的《订补2》吗?下载来看看。

我有一个自己的Access版,源文件跟你一样是文本pdf(也有文本pdg)。当年草草导入资料库,没细看。可能用Access的“不匹配”query,和你的版本对比一下。

我的书架上就有《汉语大词典订补》,也是厚厚一大册啊!别说完善《汉语大词典》电子本,真要完善《汉语大词典订补》的电子本,可能就要花不少时间。

我用电子本的哲学是:ocr图像,检索ocr文字找对应的图像,修改ocr文字,随用随改,有用到的部分才改。

不过《汉语大词典订补》好像没有图像版。

补充说明:

ocr前,确保图像的号码与书的页码一致。用finereader做ocr,用老马的comicview看。

假如有一个图像是0001.tif,ocr文本是0001.txt,用comicview打开0001.tif,会同时开启0001.txt,就可以校对改正文本。看图和改文本都可以用comicview做。

1 Like

这种大部头,最差的是一个人昏天黑地、眼老昏花单干,往往没有保留修改的完整记录,花费大力气修改后的版本要跟别的版本合并的时候,发现两者底本不一样,食之无味弃之可惜。

其次是多人分工、一起同时上,但这种方式的changlog也不完整,而且质量不一,错讹较多,只适合于需要大量体力劳动的初始版本。

比较好的做法是架设Wiki,大家在使用过程中发现问题可提出issue,编辑操刀者审定,定期汇总发布新版。这样修改过程被完整记录了下来,以后若出现更好底本、也容易后出转精。

@endnote

同意使用Wiki集体修订是比较好的方法。但是难以使用广为人知的Wiki网站,太张扬可能会惹来麻烦。