《汉语大词典》电子版订正讨论

我奇怪这个怎么查不到。再检查之后,发现我用程式处理文本,在“清”这一段出了状况,掉了一些资料。得人工对比旧资料,手动补上。

感谢你帮我发现了问题。

这么巨大复杂的文本,遇到前所未见的各种状况啊。

我相信兄弟你手上是目前修正最多的本子了,希望有釋出的計畫。

边用边改,修订进度非常慢。可能只改了千分之几的资料。

改了一些问题,大概又制造出不少新问题,只是有待发现。

坚持校改勇气可嘉,萤烛之火希望可以汇聚出燎原之势

1 个赞

我刚才把备份找出来检查,发现备份的数据也坏了。只好从mdict的原始文本重做一份,用来修补损坏的部分。

不过这下明白原因了。文本太大,用Emeditor替换数据时,替换一次后,必须先保存,才能做下一个操作。

否则Emeditor支持不住,来一个critical error,数据就有一部分被破坏了。假如没注意就保存,破坏的部分就被保存了。

还好损坏的部分大约只有十几条,手动修补还行。

这是因为《汉语大词典》文本巨大得恐怖的原因。以前还没见过Emeditor崩溃。

1 个赞

内存不够大吧,我16g的出现过你说的问题。在64g的那台上就没事,猜的不一定对

内存不够大,C盘也不够大。Emeditor报告什么disk full,大概和finereader一样,利用C盘临时文件弥补内存不足的问题。

1-2-2023

融合不同版本,因新旧字型不同导致资料混乱

1.乘虚蹈隙 (新字型“虚”,页码错误)
2.乘虛蹈隙 (旧字型“虛”,页码正确)
删除1,将2的“乘虛蹈隙”改为“乘虚蹈隙”。

3.距虚 (新字型“虚”,页码错误)
4.距虛 (旧字型“虛”,页码正确)
删除3,将4的“距虛”改为“距虚”。

5.賣空虚 (新字型“虚”,页码错误)
6.賣空虛 (旧字型“虛”,页码正确)
删除5,将6的“賣空虛”改为“賣空虚”。

7.賣虚脾 (新字型“虚”,页码错误)
8.賣虛脾 (旧字型“虛”,页码正确)
删除7,将8的“賣虛脾”改为“賣虚脾”。

9.鄉壁虚造 (新字型“虚”,页码错误)
10.鄉壁虛造 (旧字型“虛”,页码正确)
删除9,将10的“鄉壁虛造”改为“鄉壁虚造”。

光盘2.0mdx大概是用图像版的页码来匹配文字版的页码的。但是图像版用了很多旧字型,而文字版用新字型。匹配不到时,就会出现:

a href=“entry://DCD000000”>0000

自动注音遇到难字,无法注音时,会出现zz的符号。

可以在文本中查找“DCD000000”和“zz”,或者用Emeditor提取出来。

1 个赞

“飆”字众多异体字造成的资料错乱

〖校记〗“風飆”(0635左)亦作“風飇”(0635左)、“風飈”(0635左)、“風飊”(0635左)、“風颷”(0631右)、“風𩗹”(0632左)。

《汉语大词典》12-0635左有四个异体字,各种电子版都搞得一塌糊涂,或者糊涂一塌。

原始光盘用了“風”(0635左)的词头,但是把“風”(0635左)和“風”(0635左)的例证合并在一起,这个资料就重出,然后一塌糊涂、糊涂一塌了。

《汉语大词典》
〖風飆〗
1.暴风。《吴子·论将》:“居軍荒澤,草楚幽穢,風飆數至,可焚而滅。”唐玄奘《大唐西域记·磔迦国》:“時候暑熱,土多風飆。”宋苏舜钦《奉酬公素学士见招之作》诗:“安得此身有兩翅,颯然遠舉隨風飆。”《南齐书·王俭传》:“秋葉辭條,不假風飊之力;太陽躋景,無俟螢爝之暉。”《资治通鉴·晋武帝太元八年》:“譬如養鷹,飢則附人,每聞風飊之起,常有陵霄之志。”
2.《吴子·论将》:“居軍荒澤,草楚幽穢,風飆數至,可焚而滅。”唐玄奘《大唐西域记·磔迦国》:“時候暑熱,土多風飆。”宋苏舜钦《奉酬公素学士见招之作》诗:“安得此身有兩翅,颯然遠舉隨風飆。”《南齐书·王俭传》:“秋葉辭條,不假風飊之力;太陽躋景,無俟螢爝之暉。”《资治通鉴·晋武帝太元八年》:“譬如養鷹,飢則附人,每聞風飊之起,常有陵霄之志。”

必须拆成两条,改成:

《汉语大词典》
〖風飆(U+98C6)〗
暴风。《吴子·论将》:“居軍荒澤,草楚幽穢,風飆數至,可焚而滅。”唐玄奘《大唐西域记·磔迦国》:“時候暑熱,土多風飆。”宋苏舜钦《奉酬公素学士见招之作》诗:“安得此身有兩翅,颯然遠舉隨風飆。”

《汉语大词典》
〖風飊(U+98CA)〗
同“風飆”。《南齐书·王俭传》:“秋葉辭條,不假風飊之力;太陽躋景,無俟螢爝之暉。”《资治通鉴·晋武帝太元八年》:“譬如養鷹,飢則附人,每聞風飊之起,常有陵霄之志。”

風飆(U+98C6)的“飆”字有三条狗,風飊(U+98CA)的“飊”字有三把火。

看了这个“飆”字的异体字,我觉得古人真是太闲了,自找麻烦。现代汉字的规范化真是非常有必要。

《汉语大词典》电子版“亦作”使用了错误的异体字

【宫棋】
亦作“宫棋”。
按:从光盘开始就错了。当改为:亦作“宫棊”。

图像索引版用的是旧字形“”,文字版用新字形“”。但是光盘版竟然混合用两种字形:

棋】亦作“”。

可以说一塌糊涂。

【丹雞】
亦作“丹鶏”。
按:“丹”当作“丹”。
所链接的字又没解释,何必多此一举链接?显然这是用程式做的,没有做人工检查。

風概 (U+98A8 U+6982)–風槩 風㮣
亦作用了“槩”(U+69E9),实际的词头用“㮣”(U+3BA3)。

《汉语大词典》的“或读”

【從3】【從3容】【從3容不迫】
〖校记〗《汉语大词典》“從3”:“cōnɡ,或读cónɡ”。《现汉7》:“从容 [cónɡrónɡ](旧读cōnɡrónɡ)”。《汉语大词典》“從3”之读音当用“或读cónɡ”,方与《现汉》相合。自动注音选了旧读,不对。

又如“風3”,旧读fènɡ,今读fěnɡ。显然必须用今读fěnɡ,通“讽”。自动注音用旧读fènɡ注音,就大错特错。

風3指(feng3|zhi3)

8-2-2023

【衮衣繡裳】
亦作“袞衣繡裳”。
当作:亦作“衮衣綉裳”。四个字错了两个。

【皓皓】
亦作“皜皜”。
〖校记〗按:“皜皜”实有此词,然图像本所收者乃“皓皜”。

13-2-2023

【涉
,一本作“獵”。
按:“䗶”当作“𨆍”,音liè。这可能是从方正版复制过来的资料,但是在替换图像字时出了差错。此条解释重出,当删除重复部分。

【跋
按:“䗶”当作“𨆍”,当据图像本改。注音当改为liè。跋躐 (跋𨆍,跋{足葛},U+2818D)。

【五齊】(原始光盘数据如此,非mdx所改,不过注音当然是mdx的自动注音)
五齊1wǔ qí亦作“五”。
五齊2wǔ qí亦作“五齏”。

对照图像版:
五齊1(—jì)亦作“五𨣧”。
五齊2(—jī)亦作“五齏”。
〖校记〗“五𨣧”:“𨣧”({酉齊},U+288E7)音jì,酒名。
按:文字版“亦作”的资料往往与原书不同,一定得对过图像版才能引用。“亦作”的资料需要专项校对。

【不𦢌】不顺服。亦指不顺服者
【不譓】不顺服。亦指不顺服者。
〖校记〗“𦢌”(U+2688C):胎儿夭折。“不𦢌”同“不殰”,其解释当同“不殰”,言“胎不坏死”。此处解为“不顺服。亦指不顺服者”,与下条“不譓”(同“不憓”)之解释相同,必手民之误。


釋義4闕文.

應該是缺繁體部份而已。

简体解释一字不缺。繁体解释整个不见了。

你用繁体解释很吃亏啊,得自己查漏补缺。

修訂那麼一大部辭書,至少得動員幾百中文系的先生,結果還未必能讓人滿意。咱們遇到一個是一個,不求完善,但求寡過而已。

鞾2鞾
光明貌。
唐 张说《赠户部尚书河东公杨君神道碑》:“鞾鞾七德,侁侁六藝,公之亢宗,美爲世濟。”
刘师陶《次韵和钝根闻韩事有感》:“故宫禾黍油油緑,廢冢棠梨鞾鞾華。”

少实兄,您的数据库能找到刘师陶的《次韵和钝根闻韩事有感》吗?我百度了一下,有刘师陶的诗,也有《次韵和钝根闻韩事有感》,但没见到刘师陶写的《次韵和钝根闻韩事有感》。

这是现代人。我的资料库没有现代资料。谷歌也很难查到现代资料。

搜韵有这两首:

闻韩事有感和钝根韵 近现代 · 龚尔位
七言律诗
仲连去后英风息,无复衣冠见汉家。
一片降幡沧海静,千年碧血夕阳斜。
鹤归应起山河感,狐死空传鬓发华。
来日潮流愈澎湃,怕看大地走兵车。

次韵和钝根闻韩事有感 近现代 · 方荣杲
七言律诗
万顷鲸波天地动,神州谁是国忘家。
河山漫吊箕封碎,日影畴怜禹甸斜。
风色苍茫添怅恨,衣冠涂炭问夷华。
杖藜早入深山去,羞见中原鬼一车。

搜韵只有一首刘师陶的作品:

人物简介

刘师陶,字少樵,号沧霞,湖南醴陵人。

七言律诗
夜泊 近现代 · 刘师陶
七言律诗
挂席迎流不计程,停舟水驿更忘名。
天风作雪寒侵骨,岸犬惊人吠有声。
半壁河山伤豕突,片时泥爪类鸿征。
宵深愈觉愁无奈,斜倚孤篷数断更。

1 个赞

《詩‧小雅‧常棣》:「常棣之華,鄂不韡韡。」毛傳:「韡韡,光明也。」

把极个别刻本中的讹字当成通假字,大字典、大词典这点很不好。

按照大词典的标准,“鞾鞾七德”、“韡韡七德"都是正确的,实际上前者错的离谱,正确刻本都是"韡韡七德”。想给讹字找例证,当然很难找,那就只能拿近现代刘师陶的打油诗来滥竽充数了。

我也觉得它这里可能搞错了 :joy_cat:


釋義6 缺第二例句:唐杜甫《岳麓山道林二寺行》詩:“塔劫宮牆壯麗敵,香廚松道清涼俱。”楊倫箋注:“通『級』。”

本条所缺资料不少,根据方正本都可以补上。

3.指盗贼,劫匪。
南朝 梁慧皎《高僧传·诵经·慧进》:“時有劫來問進:‘有物不?’答云:‘唯有造經錢在佛處。’群劫聞之𧹞然而去。”

6.宫殿或塔的阶级。
唐杜甫《岳麓山道林二寺行》诗:“塔劫宫牆壯麗敵,香厨松道清涼俱。”杨伦笺注:“通‘級’。”

7.通“蜐”。---->通“蜐”、“𧉧”。
南朝 梁江淹《石劫赋序》:“海人有食石劫,一名紫䖀,蚌蛤類也。”唐王维《送元中丞转运江淮》诗:“去問珠官俗,來經石劫春。”劫,一本作𧉧。