教育部重编国语辞典地名信息严重滞后,建议重抓

很多人总觉得修订词典只是增加新词,频繁更新没多大意义,却不知现有词条内容的修订也是至关重要的,在不断进行中的。今天突然发现旧版的一条地名信息很是滞后:
查“汉白玉”条,WFG版提到“河北省房山縣”,有些存疑,一查网络,发现房山县早在上世纪五六十年代便已变更,先是合并为区,然后划归北京市。

WFG版(2021年11月修订版,仅修订了一些英文地名等错误,主体数据仍是以前的旧版):
对比 Quantus版(2021年新抓取数据):


目前官网版:

“荨麻”条:
WFG版:

**Quantus版:**缺失(似乎官网在改版时一度也查不到该词)
目前官网版:

“荨麻疹”条:
WFG版和Quantus版:

目前官网版

3 个赞

WFG和skippy大侠都有修订,其中skippy大侠修订了大量外文部分的错误。他们肯定留有修订数据吧。
主要我还不会转换“生肉”啊,不然我就自己动手了。。。

1 个赞

需要最新数据的人,最好是使用《国语词典》的网站,反正是免费的。

国语词典

无法用代理去上网的大陆书友,就用Wfg的版本或本坛的版本。

有书友在百度盘提供wfg的《国语辞典》m-dict。

搬运wfg词典

执意要最新资料的m-dict的,可能得考虑自己动手。

我去下载了资料,看了一下,是某些书友最喜欢的格式:Excel资料档。因为太大,我的Openoffice在打开时冻结了。

https://language.moe.gov.tw/001/Upload/Files/site_content/M0001/respub/dict_reviseddict_download.html

我想Excel的数据应该是比较好处理的。

但是请注意Wfg做了什么:

於是取了官方公布的最後版本「dict_revised_2015_20160523」的數據,重新製作一部《教育部重編國語辭典(第五版)》離線辭典。

這次的製作因為已是第二次,嚴謹度更勝從前。把舊的圖片字對照表重新核對了一遍,多有修正,然後將大部分的缺字都自行造字,補進「全宋體」的補充字之中【註①】,並將所有資料都處理成純文字【註②】。

我曾經列舉的瑕疵與錯誤,官方數據幾乎都修正了,但還是有些我無法一一列舉的錯誤,官方沒有改到。例如:「琉璃球兒」條, “一” 字誤植為注音符號的 “ㄧ”;「調號」條,符號 “-” 誤植為注音符號的 “ㄧ”[/color]

(略)

網路第五版不知何故將第四版原有的 116 條「辨析」資料全數刪除。我個人認為這些「辨析」資料仍甚有參考價值,故從第四版數據中將之抽出,仍補入第五版之中。以 辨 標示,並加襯灰底,以提醒使用者注意這並非第五版的原生數據,特地補入只為方便對照參考。

得替换图片字,不是直接把资料弄成mdx就可以。

Wfg修正了官网的一些错误,有的小错误没有回馈给官网,所以仍然留在官网上。

Wfg还保留了旧版的一些有用资料,没完全跟随新版。

不容易啊,怎样做到这个水平?得花多少时间?

《国语词典》有15万多条,接近半部《汉语大词典》。这是一部大词典。

1 个赞

辞典免费,这一点大陆还是得向台湾学习
多谢,终于又看到音频材料了

1 个赞