成语源流大辞典校对

成语源流大辞典校对

感谢iii_1书友辛苦制作ocr文字版及可供参照的图像版mdx。

有兴趣参与校对的书友可在此下载iii_1书友的大作。

图像版应该没什么问题,也许只需要校对词头。

ocr文字版可能需要很长、很长的时间才能扫校一遍。

我想最关键的还是校对词头——主词头和主词头下的亚词头。其次是解释。例证因为引述多,牵涉到的难字多,容易出错,但相对而言没那么重要。

建议大家主要把精力放在词头上。

先开个校对帖,慢慢弄吧。

原帖的校对

> </>
> 爱不释手
> <link rel="stylesheet" href="HYCYYL.css"/><cy>【<hw>爱不释手</hw>】ài bù shì shǒu 喜爱得
> <br/><br/>又作[<kw>爱不忍舍</kw>],舍(shě) :弃;放下。
> 〖不忍释手〗

大体而言,《成语源流》的格式是这样的:
【主词头】汉语拼音
亚词头:又作,间或作等等
〖副词头〗
亚词头:又作,间或作等等

我这里称为“副词头”的,大概是凡例4下所说的“次主条”。
主词头特点为【X】后有汉语拼音,mdx文本必须改成:

<link rel="stylesheet" href="HYCYYL.css"/><cy>【<hw>X</hw>】

还要在前两行增加</>+词头。

没有拼音又没有又作的不是主词条,是副词条。用〖〗套起来,有时〖〗误作【〗、【】,需统一为〖〗。〖〗前需加<p>分行,〖〗内须加<kw>标签,以后才容易提取为词头。

原校对帖已经发现了一些主词头没有加标签。

我又找到了131个。

需要处理的主词头(zip压缩档)

变成【X】、【X〗的〖副词头〗,我目前找到的有528个。

yuant.zip (42.2 KB)

[todo.zip|attachment](upload://zUqTtxgz1lJMMm1pJtXtVCVDsAa.zip) (5.9 KB)

呵呵,只开了个头,还需要弄很久,非常久。但是做得有兴致了,成果也有点意思了。

图像版私用字:
蝂–>𮔅蝂
蝉U+E26B蟹筐/蟹匡蝉U+E26B
U+E26B–>𮉫
怨U+E64B载道/载途怨U+E64B
U+E64B–>𮙋

文字版错误:

【冬温夏清】 -->冬温夏凊
内文“凊”多误作“清”。

【唇历(歷)齿〗 -->〖齞唇历(歷)齿〗
【铢必较】–>【锱铢必较】
又作[铢必较]。–>又作[铢锱必较]。
【方为圆】–>【刓方为圆】
【赖缘高】–>【𮔅蝂缘高】
[赖升高]–>[𮔅蝂升高]
【蟹匡蝉缕】–>【蟹匡蝉𮉫】
[蝉缕蟹筐]–>[蝉𮉫蟹筐]
【怨声载道】
[怨载道]–>[怨𮙋载道]
[载途怨]–>[载途怨𮙋]
[船求剑]–>[锲船求剑]
鹧天–>鹧鸪天

1 个赞

13-7-2024

[<kw></kw>]
戏曲会用到[生][旦]之类,有[X]。这些[X]被错误地加上了关键词<kw></kw>

“”出现120次,为ocr辨识不出而造成的缺字。
一个词条假如有制造麻烦的字,整个词条就会有很多问题,无法一一列举,也不一一列举。许多错字报告太麻烦,我改了就算,不报告了。
【白饭青刍】
又作[青刍白饭],刍也写作“”。–“𫇴”
【板上钉钉】
原或作[石上钉]–>原或作[石上钉橛]
竧:后书作“” “”–>“䠴”
【剥肤椎髓】
椎也作“”。–>椎也作“槌”。
【布衣之交】
详:通“”。–>详:通“佯”。
【惨绿少年】
惨:同“”–>惨:同“黪”
【卬首信眉】
劻勤–> 劻勷
ráng):急迫–> 劻勷(kuāngráng):急迫
【缝幽凿险】–>【缒幽凿险】
又作[缝险凿幽]–>又作[缒险凿幽]
【行同狗】–>【行同狗彘】
【清夜们心】–>【清夜扪心】
参看【心自问】–>参看【扪心自问】
[胸自揣]–>[扪胸自揣]
【伏而天】–>【伏而咶天】
【越俎代府】–>【越俎代庖】
本条多处掉了“庖”字。“庖”或误作“府”、“疱”,或脱漏。

14-7-2024
图像版替换:
쬺 -->𬬺
듧 -->𫓧
돋 -->𫏋

文字版错误:
【湖狲入布袋】–>【猢狲入布袋】
【狲失树】–>【猢狲失树】
原也写作[鹃孙失树]–>原也写作[鹘孙失树]
后世多写作[糊狲失树]–>后世多写作[猢狲失树]
【尔蹴尔】–>【嘑尔蹴尔】
【指困相赠】–>【指囷相赠】
【借书一瓶,还书一】–>【借书一瓻,还书一瓻】
又省作[一容借]–>又省作[一瓻容借]
又省作[借]–>又省作[借瓻]
【彝伦攸致】–>【彝伦攸斁】
【瓜(之)系(繫)】–>【匏瓜(之)系(繫)】
【牧牡骊黄】–>【牝牡骊黄】
【麑触槐】–>【𬬺麑触槐】
钽麑–>𬬺麑
副词头“𬬺麑之悔”原误作“𬬺慶之悔”,兹改。
【黄绢幼妇,外孙齑白】–>【黄绢幼妇,外孙齑臼】
【善闭无关健】–>【善闭无关楗】
【炙雕龙】–>【炙輠雕龙】
按:纸本是“輠”的类推简化字,有Unicode(U+30E8D)了,很难显示,从图像本mdx用繁体字。
驺爽(zōu shì)–>驺奭(zōu shì)
【熊罴人梦】–>【熊罴入梦】
【凤凰在】–>【凤凰在笯】
【小德出人】–>【小德出入】
【惊龙感帨】–>【惊尨感帨】
又作[感帨惊龙]–>又作[感帨惊尨]
【树倒湖狲散】–>【树倒猢狲散】
【轮老手】–>【斵轮老手】
按:图像版mdx索引用“斲轮”,图像为“斵轮”,我统一用“斵轮”。
【银样锻枪头】–>【银样镴枪头】
【陟之望】–>【陟屺之望】
[陟妃之恋]–>[陟屺之恋]
本条“屺”字多脱漏。注意“陟岵无依”所用乃“岵”字。
【狗不食其馀】–>【狗彘不食其馀】
本条“彘”字多脱漏。
【路鬼掷揄】–>【路鬼揶揄】
本条“揶”字多脱漏。
【窃铁之疑】–>【窃铁之疑】
本条“𫓧”字皆误作“铁”。
【祖裼裸】–>【袒裼裸裎】
又作[裸袒裼]–>又作[裸裎袒裼]
【敲金戛玉】
本条“戛”字多误作“夏”。
又作[扬扢藻]–>又作[扬蘤扢藻]
[足而待],娇–>[𫏋足而待],𫏋
[足而须]–>[𫏋足而须]

1 个赞