《汉语大词典》电子版订正讨论

《汉语大词典》电子版订正讨论

原帖太长了,很难阅读,另起炉灶开个新帖。

这个话题只讨论光盘2.0版。光盘3.0版我认为无可救药,不必浪费时间讨论。

旧的讨论见此帖

把我在旧帖刚发的最后一个回复乾坤大挪移搬过来,作为第一帖。

《汉语大词典》

《汉语大词典》
【震】震動摇。《宋史·洪咨夔傳》:“陛下親政以來,威福操柄,收還掌握,揚廷出令,震海宇。”明何景明《進舟賦》:“震撼擊撞固多端兮,心應之而遂平。”巴金《創作回憶錄》九:“說謊的文學即使有最高的‘技巧’也仍然是在說謊,不能震撼多數讀者的心靈。”
少实斋按:词头“震憾”,解释“摇憾”,例证“震憾海宇”,“憾”字皆当作“撼”。《宋史》(中华本)页12265:“陛下親政以來,威福操柄,收還掌握,揚廷出令,震撼海宇。”

“震撼”误作“震憾”,根源在《汉语大词典》
新浪博客,2009-01-04
我认为,《汉语大词典》“震憾”词条,原本就是“震撼”一词。由于把其中的“撼”字误作了“憾”(“撼”、“憾”形误,失校致误),所以词条、释义、书证都出现了错误。如果把“震憾”词条中的三个“憾”字都改为“撼”,那么这个词条就还原为“震撼”了。如:震撼:震动摇撼。《宋史·洪咨夔传》:“陛下亲政以来,威福操柄,收还掌握,扬廷出令,震撼海宇。”明何景明《进舟赋》:“震撼击撞固多端兮,心应之而遂平。”巴金《创作回忆录》九:“说谎的文学即使有最高的技巧,也仍然是在说谎,不能震撼多数读者的心灵。”这样,词条、释义、书证都顺理成章了。“震憾”,这是个错误的词汇,应当取消。
笔者2007年6月曾经发表过博文《〈汉语大词典〉“震憾”一词辨误》,在这里对拙文作些补充。

《汉语大词典》
【感同身受】感到像親身承受一樣。袁鷹《祖國的泥土》:“這支民歌那樣强烈地震撼我們的心靈,也還由于對受苦受難的越南人民,我們是感同身受的。”
少实斋按:图像版“震撼”误作“震憾”,光盘版已改正。

《汉语大词典》图像版模糊版

《汉语大词典》图像版清晰版

《汉语大词典》
【丑肉】牛肉。十二生肖丑屬牛,故稱。唐讀《宣室志·朱峴女》:“夜叉曰:‘牛者,所以耕田疇,為生人之大本。苟不食其肉者、則上天佑之。故我不敢近也。’……明日,夜叉去而祝曰:‘某願終身不食丑肉也。’”
少实斋按:《宣室志》作者“李读”当作“张读”。

《四庫全書》C290021“宣室志 / 補遺”,(唐)張讀 撰。

国学数典“为了学习而注册”书友:“我读的时候也发现‘丑肉’那条《宣室志》的作者成了‘李读’。”

3 Likes

国学数典“为了学习而注册”书友:“今天写文章时又发现放棹这个词条里居然出现了《己刻杂诗》!”

《汉语大词典》
【放棹】乘船,行船。清龔自珍《己刻雜詩》之一二二:“六朝古黛夢中橫,無福秦淮放棹行。”郁達夫《游金馬侖之作》詩:“三年放棹西溪夢,忽見蘆花似夢中。”
少实斋按:“己刻雜詩”是光盘版的错误。图像版是“《己亥雜詩》”,不误。

2 Likes

關於 震憾/震撼

按本義,“撼”更妥,但沒必要改吧,不如保留印刷版的“震憾”,加個跳轉(震撼@震憾)就得了。

能查到詞條最重要;要把龐大的數據規範化,事倍功半。再說,有點像把古文的“說”yue4規範為“悅”,我覺得沒必要,不如花功夫增補詞目跳轉。

而且詞目跳轉可以收下了,用在大詞典的更新版,和其他mdx.。若改正文數據,等到新版一發出來,都變成白做的。

这个很明显是错字,词条、解释和书证都错了。但是图像版的错误当然不能直接改,加个按语,另外用“震撼”补个跳转。

1 Like

震憾/震撼的问题现在比较容易解决,搜一下古籍好了。不过当时编《汉语大词典》的人没这种条件,都是人肉抄卡片,要覆核原籍,搜查书证比较困难。

至于所谓的图像版,也不是可以真的“有图为证”,以之为smoking gun,作为铁证的,N多年前,有网友就验证了超星图像PDG会出现奇怪的文字错误,原书不错,图像文字错误,讹为它字,具体什么问题,就要问史超了。


一白衣夜叉辟易退逺百步不敢竊視及其暮歸因
詰之何為懼彼白衣者乎夜叉曰向者白衣自少不
食太牢故我不得近也女窮其故夜叉曰牛者所以
耕田疇為君民之大本茍不食其肉者則上天佑之
故我不敢近也女默念曰吾人也去父母與異𩔖為
伍可不悲乎明日夜叉去而祝曰某願終身不食丑
肉也三祝已夜叉忽自他所歸浮圖上望某而語曰
汝何為有異志棄我乎使我再不得近汝也從此别

《汉语大词典》对“丑肉”的书证引用也是不准的,“君民之大本”不是“生人之大本”。

网友订正《汉语大词典》电子版,在我看来属于蚂蚁扳倒喜马拉雅山的悲壮之举,其志可佩,其愿可哀,其果可叹。这些遍地皆在的错误是改不完的,还没等你改完,可能有新版出来了,如果一个人有实力和精力时间与这么一个风车作战,为什么不另起炉灶自己编一本词典?汉大本质上是政治意志政治工程的产物,为了追英(OED)赶美(《韦氏新国际》),你有50万词汇的词典,我也需要有同量级的一部,你有大英百科,驰名全球,连苏联也有《苏联大百科全书》,我不得也有一部《中国大百科全书》,于是拼凑捏合起一些草台班子粗制滥造,给上头交差。至于有没有人看,质量是否过硬,是不是适合市场/民众需求,都是次要的问题了。

此种政治意志造书、编书,而不是真正的出于兴趣和激情,志于藏诸名山,导致的结果是很不一样的,对这些书这类书,我看无需认真对待,要用到时顺手翻一下,对书中的说法半信半疑,批判性阅读,确实自己要引述就去复核原始材料,反正网络时代唾手可得。

4 Likes

说草台班子、粗制滥造有点过了。。。当时古籍资料没有电子化,纯粹靠人工、靠卡片,编纂实属不易,自然也存在非常多的问题,期望新版本的质量能高一些吧。

3 Likes

(1)扫描图像而成的图像本,可能模糊,但不可能弄错成别的字。超星的pdg,有的是ocr后做成的文字pdg,当然可能有错误。假如把文字版打印成图像版,所产生的图像也可能有错误。

(2)《汉语大词典》是一千多名学者集体劳动的成果,有三十几万条词条,区区网民,当然不可能重编一本,也不可能全面修订。但是在使用时发现问题,应该发帖讨论。讨论后有人注意,才能更正。

(3)看问题的角度要全面,评论要公正平允。《汉语大词典》在同样规模的大型工具书中,质量实属最佳。规模太大,书出众手,难免会有错误。应该就事论事,就错误论错误,不宜因少数错误而随意贬低全书的质量。

《汉语大词典》、《中国大百科全书》皆属划时代的工具书,体现了一国国力的增强。

(4)《四库全书》本并非善本,学者假如有别的版本可用,一般不会用四库本。例如一书有四库本,有四部丛刊本,学者引用必用四部丛刊本。不能拿《四库全书》本去纠正《汉语大词典》的引文。假如愿意纠正,去查一下ctext非《四库全书》版的图像吧,或者跑图书馆去查善本的刻本。

(5)除非引文有明显错误,不然不必查原书。可以读通的引证就由它去了。哪有人可能去查各种善本来改《汉语大词典》的书证。假如自己写论文要引用,当然得去查原书。《汉语大词典》的书证只能作为线索。

3 Likes

你觉得过了,我没觉得过分啊。所谓盛世修典,埃及的亚历山大图书馆,清朝的《康熙字典》、“四库全书”,英国的OED、Encyclopædia Britannica,美国的《韦氏新国际》都是在帝国极度强盛,物质丰裕,文化发达,自信心爆棚,放眼天下,舍我其谁,志在把本族的语言和全人类知识一网打尽的时候编撰的,所以规模往往比较夸张,但这个夸张是有帝国繁荣的经济和济济人才保证的。

反观《汉语大词典》和《中国大百科全书》,都是在1970年代后期起步的,物质条件不说,当时有多少人长期研究古代汉语和古典文化?“山东、江苏、安徽、浙江、福建、上海五省一市的1000多名语言文字方面的专家学者”,啧啧,文革刚结束,10年学也不上,一下子“五省一市”就冒出来了“1000多名语言文字方面的专家学者”,你现在在五省一市找出来1000名货真价实的语言文字方面的专家学者试一试。

《中国大百科全书》我都懒得评论了,很多年前就下载过电子版,捏着鼻子翻阅了一下,直接从硬盘删除,好好的大英百科不用,去参考引述中国大百科,我自认丢不起这个脸。

1 Like

你这只是想当然而已,当然这也是大多数人的想法,扫描的图书就是拍照罢了,原件和拍出来的照片是一样的,但超星的某些PDG图像电子书并非如此。推测可能是书扫描出来顺便OCR了一下,然后把OCR的文字用某种技术叠加到图像层,于是OCR的错误也带回到原始图像了,至于具体怎么实现的,技术细节不清楚,超星官方也没有答复过。

我已经说了问史超了,很多人可能不知道史超是谁,史超是超星的老板,大概在20年前,超星有自己的官方读书社区,史超偶尔也会在论坛露面。

提个建议,这贴只讨论具体的错误为好,不相关的话题如果太多太长会导致此贴难以阅读,可以另开新贴讨论。

2 Likes

《汉语大词典》想编好,一、要有钱;二、至少要有钱三代,不愁吃喝到了第三代会出现些雅好文化艺术的富贵闲人;三、政治开明,不受意识形态影响或污染,你不能总引些红色作家的书证,而把张爱玲林语堂等重要汉语作家几乎忘了。

有钱之后,首先要做的是大规模清点整理古籍,起码把它们扫描数字化了,OCR识别,以方便搜索,其次,考证这些古籍,给他们断代定时,这样才能把词语、文字历史演变传承的脉络理清楚,像OED或者韦氏词典那样给出首次出现时间和词源,再次,搜集整理现当代文献语料库,然后组织专家搭建编辑队伍。

词典编好了,它应该是开放性的,花的是纳税人的钱呗,而且,开放性的词典才有利于在公众使用过程中及时反馈,订正讹误,不断使之趋于完善。

仔细想一下,这些条件是否具备了,可以真的编出一部高质量的传世经典?

2 Likes

abs说得是,歪楼了。继续歪下去,就像是踢馆了。

3 Likes

图像格式的PDG不存在这种问题。
现在的汉语大字典、汉语大词典的图像MDX都是图像格式的PDG。

用证据说话,不必危言耸听。

3 Likes

原来是遇到了一个杠精。《<汉语大词典>编纂出版工作的回顾》:「参加资料和编写的人员前后共有1000多人。」

汉语大字典、汉语大词典、辞源修订版等等都是1975年发起的,都算是研读古籍必备工具书了。

你用个中国大百科还丢脸,真是老太太说相声,把爷给整笑了。你的脸大不大不知道,高高在上的姿态,想必脸皮是够厚的。

井底之蛙而已,网络很大,本网站似乎也有港台、欧美等华语人士出没,你去打听一下他们写文章写书是参考大英百科还是中国大百科?随便一条wiki英文版也很可能比中国大百科强得多。

你是夜郎自大而已。网络当然很大,中国大百科全书已经更新到第三版了,百科全书包罗万象,既是方便大家查阅,也可以用来增长见闻。

用是否有学术引用来判断一本书的好坏,自己不觉得可笑吗?书店里学术上不会引用的书多着呢,难道林语堂、张爱玲的书就引用的多?

真正严谨的学术文章,到处引用大英百科?到处引用英文维基?

没有缘由,我何必搞这种危言耸听?1楼引的丑肉,都出自《汉语大词典》,我猜底本很可能是一样的,因为版式一样,超星也没有必要同一本书扫好几次,但何以一个是李读,一个是张读,于是我想起这桩陈年旧事。你让我给证据,我现在给不出,超星的读书论坛早关闭了,或者去花费极大时间与精力去确证这个说法,一本本书读,碰运气,还要把相应的纸本书买到手里。

目前有个最简单的初步方案, shaoshi网友查看一下两个《汉语大词典》电子版的版权页,看是不是同一个扫描底本?如果底本确实不同,那只能暂且是个悬案。

图像版PDG错误,比较罕见,也可能是一段时间一批图书出现的问题,自从网友提出质疑后,超星更改了方案,相隔这么久,更难查证,网友姑妄听之好了。

2 Likes

匿名攻击骂人,可不是本论坛提倡的作风,我也是闲得无聊,才参与此类网络口水。

2 Likes