《汉语大词典》v2.0 原始纯文本

不少人关注、喜欢《汉语大词典》,但实际上就目前所知所见的民间各种电子版(mdx等)都存在比较严重的缺陷,或者是繁简转换带入的问题,或者本身是严重阉割的版本(比如繁体3.0版),或者夹杂着私自改动而无校记带来的版本污染,恰好我这里有一个早期收集的纯文本文件,创建于2007年,无任何私下更改,可能直接提取于原始GBK内码的2.0版光盘,它应该是一个比较优良的底本,在此分享一下。

文件原来在 汉语大词典,繁体自制版 - #8,来自 mixivivo 贴过,是跟帖,或许有些新用户不知道,依然在各种谬误、错乱的底本基础上搞《汉语大词典》的自制、改版、校订,白白浪费很多力气,因此现把它转为主帖。

汉语大词典 V 2.0.part1.rar (20 MB)
汉语大词典 V 2.0.part2.rar (20 MB)
汉语大词典 V 2.0.part3.rar (3.7 MB)

16 个赞

让人难受的是下划线的丢失,如果有办法找回的话,不失为最优解

2 个赞

确实,这个没有下划线。

1 个赞

国学数典的2.0程序

3 个赞

依我个人的浅见,下划线无关紧要。

你只给个国学数典的链接,什么也不说,是让大家自己猜谜?

看国学数典该帖的说明和回帖反映:
方便查繁体字的工具书软件 共24个卷 539M
这是安装版,跟纸质版有较大区别
输入的字、词要求是繁体才能检索。检索出来的内容可以复制粘贴出来直接编辑使用,对于字、词一般皆有古文献例证。

这个大小刚好和2.0光盘版差不多一样。

没有2.0光盘版光盘的,有兴趣可以去试一下。2.0光盘还是不错的,我偶尔还用。

不是数典会员的得先注册,注册一段时间后才能下载。

为免有人苦求3.0光盘版,我多说一句:别弄3.0光盘了,和2.0光盘相比,那是一个削足适履、惨不忍睹的版本。

3 个赞

谢谢分享,可惜纯文本不适合手机上查询

2 个赞

下划线/专名号看起来古色古香、古意盎然?其实它是西化、慕洋,甚至可以说东施效颦的产物。“专名”中国人一般比较陌生,因为汉语里没这么个概念,但如果你学英语、西文,专名就很有用,Los Angeles(地名)、Dua Lipa(人名)就是专名( proper name),首字母要大写,这是文法上的严格要求。1910、20年代推广新式标点的时候,胡适、周作人、钱玄同等觉得西文专名大写这太先进、太高级了,可惜汉字无法大写,于是发明了下划线这种专名号。

专名号带来的严重问题是它不是一个像逗号、引号那样的独立存在的符号,而是依附于汉字的外加、旁加标注,害苦了文字编辑(要仔细想哪些才是专名)、排字师傅(得另造铅字或者加特别装置),也让我在OCR古籍时恨得牙痒痒,有专名的字符在OCR时经常是错误。专名号在数字化时代也行不通,因为不是独立符号,在GBK、Unicode里应该没有自己的位置,所以在plain text(纯文本)里是打不出来的,复制进来也无法保留。它是特有格式,像粗体、斜体等,而不是单独字符,只能在专门的文字编辑器里处理。

所以不必为下划线丢失感到遗憾,它或许是本不该存在的东西,方便了那些古代文献初学者一点点,却对很多别的人造成了相当大的麻烦。专名号有助于阅读、理解古典文本,那么,要不要对古文标点之外像英文一样用空格分词呢?“臣 本 布衣 ,躬耕 于 南阳,苟全 性命 于 乱世,不求 闻达 于 诸侯。”是不是又更好阅读了一点?还可以加上注音、释义,等等。或许,更需要的是读者提高自己的古文知识和素养。

6 个赞

可是《汉语大词典》纸质版上并没有“‘弌1’的今字”这个表述,请问这是怎么回事呢?

核对了一下真的光盘和图像版。

光盘确实在这样说:

一1
“ 弌1 ”的今字。

图像版确实没有。

必须认识到:光盘没有照搬图像版,自己加了一些东西。实际上,光盘加了一些《汉语大词典》没有的字,而少收了《汉语大词典》许多字和词。

我又查了下官方出的《汉语大词典》app,里面有“‘弌’的今字”这个释义,但“弌”后面没有阿拉伯数字“1””。难道这部词典有好几个版本?

2 个赞

《汉语大词典》app和《汉语大词典》光盘2.0的数据来源可能不一样。

第一版图像版有两个,有一个有改动。电子版方正版听说不一样,可能比较齐全。

我没用过《汉语大词典》app,不知道情况怎样。也许你可以研究一两个词,截图报告一下。

下列几个词光盘错了,这个来自光盘的文本应该也错了。

【愛手反裘】 – 愛毛反裘
【傅致】除益而引致—附益而引致
【笛】宙子—笛子

你可以查一下app,看app版有没有改错。知网版还是“愛手反裘”。

1 个赞

好像没人听啊

假如明知3.0版比2.0版差很多,错误很多,但是就是执意要修订3.0,那当然也可以。

古人有言:不为无益之事,何以遣有涯之生。

人家爱吃苦,吃苦当吃苦瓜,不行吗?

1 个赞

我没在app注册,只能一天查3个词,否则只能看到词条,不能看释义,今天已经查不了了。app版确实是“爱手反裘”,另两个因为是需要查释义,只能等明天了。我现在用的是繁体版的mdx,这三个全错了,但它下面有补义条目,释义比较全面,我还是继续用原来这个算了。

我觉得在“一”和“弌”后面加个“1”根本就是多此一举,严格来说应该是错误的。“一”的释义里面包括“1”,但不等于就是“1”。也就是说,app/网页版里的表述更确切。

1 个赞

你根本就没明白这个"1"是什么意思,它代表的意思跟英文词典中的can 1、can 2一样,一字多音或多义时用来区分的。

《汉语大词典》多数的情况像你说的这样。

不过像“一1 ”“二1 ”的两个“1”,图像版没有。这只是光盘电脑词典格式不精确,不是别的问题。

4 个赞

嗯,你说得对。不过我查了其他词典,都是说弌同一,没说只能做数词用啊!

*当1[dānɡㄉㄤ]
“當1”的简化字。
当2[dànɡㄉㄤˋ]
“當2”的简化字。
当3[dɑnɡ˙ㄉㄤ]
“當3”的简化字。
当4[dānɡㄉㄤ]
“噹1”的简化字。

*尠1[xiǎnㄒㄧㄢˇ]
[《廣韻》息淺切,上獮,心。]
[《廣韻》思句切,去遇,心。]
同“鮮2”。
少。
【尠少】很少。汉焦赣《易林·恒之贲》:“利得尠少,留連爲憂。”
【尠尠】很小,很浅。明朱权《荆钗记·奸诘》:“冀推年誼,借重一言,贊襄岳父母上道,以全半子終養之情,感德豈尠尠哉!”

*尞1[liáoㄌㄧㄠˊ]
[《集韻》憐蕭切,平蕭,來。]
[《廣韻》力照切,去笑,來。]
1.“燎”的古字。《汉书·礼乐志二》:“靁電尞,獲白麟。”颜师古注:“尞,古燎字。”2.通“僚”。《隶释·汉山阳太守祝睦後碑》:“尞屬欽熙,孰不咨賢。”《隶释·汉凉州刺史魏元丕碑》:“詶咨羣尞,惟德是與。”3.姓。北周有尞允。见《周书·寇儁等传附》。

*尝1[chánɡㄔㄤˊ]
“嘗1”的简化字。
尝2[chánɡㄔㄤˊ]
“嚐1”的简化字。

像这种,不是得分个1、2、3吗?不过似乎单字只有一个读音、字形,或一类释义时可以省略。

1 个赞

你看你1楼那个图。“一1”下面又分1、2、3,那就不对了,这个“1”就是不应该有的。