《汉语大词典》注音校对

我可以考虑空闲时间帮忙校对

1 Like

多谢,我也建个微信群吧,便于协作。
刚才我试着校对了几个,发现由于ocr的原因导致任务量增加不少,我再考虑看是否可以和我前面的筛选再结合一下,也许会减少不少任务。

1 Like

我之前OCR扫规范词典的时候,为了方便写声调,在搜狗输入法的“自定义短语”功能上给aeiou绑定了四个声调,打出来直接选 :rofl: OCR识别准不准还挺玄学的,同一张图,识别三遍可能有一遍能识别出声调,另外两遍不行 :rofl:

因为图片上声调本来就不清楚,所以我的方案是比较词条顺序,只要两个表单中词条顺序不一致就认为这个词不可靠,需要校准

对筛选出的9000词条再筛除首字外不是多音字的,只剩3000多条了(前面功夫没白费)。
但校正读音真不是一件容易事:
就上面那个“阿闍”,先查“闍”,《汉语大词典》有两个读音


再查文字版“阿闍”
image
再查文字版“阿闍黎”

再查图像版“阿闍黎”
image
图像版对“闍”的注音是she1,放在整个词条偏后的位置,不合常规,并且与对单字的注音(du1与she2)不合。
到底如何选择。查《词目意序索引》
image
依稀可见是she2。再与《汉语大字典》《辞源》等对照,确实读she2。
过程虽艰辛,但也挺有意思的。
以后遇到特殊的情况都在这里备上:
挨挨軋軋
緝 直接注音ji1 qi1 应为(今读qi1)缝衣边
愛手反裘 愛毛反裘

2 Likes


有兴趣的朋友请加群

查“畚梮”,解释同“畚挶”。但“挶”注音ju1,“梮”却注为ju2。因为怀疑,所以又查了几部辞书,却反而更糊涂了。梮,《汉语大字典》《辞源》《现代汉语词典》都注为ju1,《辞海》却注为ju2,和《汉语大词典》一致。看《廣韻》两个字都是居玉切,入燭,見。这种分歧可能与入声字有关。本着少数服从的原则,就暂定为ju1吧。

普通話聲調是陽平,聲母是b, d, g, j, zh, z,都原來是入聲。這個原則,我給自己造了個助記句子:“博得格局,輒足”。 :grinning_face_with_smiling_eyes:

關於“梮、挶”,若是逼我選ju1或ju2,我會按照聲符“局”,歸陽平。

我的辭源拼音索引把入聲字都標出來(“-k, -p, -t”韻尾):

去掉“挶、梮”兩例,有這樣分配:
ju1:鋦
ju2:局侷跼駶

其實“鋦”也是多音字,又j讀ju2。

一般來說,入聲派於陰平是少數,陽平更常見。我曾經做過統計哈哈:辭源收的入聲字,只有13% 現在派於陰平。(相對於32% 陽平;4% 上聲;52% 去聲)

1 Like

高人,佩服,真渊博呀!不过根据声部类推读音,或根据同声部的字去类推,还不够严谨。一个字读什么音恐怕还是取决它在生活中怎么读,历代辞书怎么注。

嗯,廣泛趨向不能決定某個案子的具體答案。我只提出廣泛的 pattern 來參考。

1 Like