很多人总觉得修订词典只是增加新词,频繁更新没多大意义,却不知现有词条内容的修订也是至关重要的,在不断进行中的。今天突然发现旧版的一条地名信息很是滞后:
查“汉白玉”条,WFG版提到“河北省房山縣”,有些存疑,一查网络,发现房山县早在上世纪五六十年代便已变更,先是合并为区,然后划归北京市。
WFG版(2021年11月修订版,仅修订了一些英文地名等错误,主体数据仍是以前的旧版):
对比 Quantus版(2021年新抓取数据):
目前官网版:
“荨麻”条:
WFG版:
**Quantus版:**缺失(似乎官网在改版时一度也查不到该词)
目前官网版:
“荨麻疹”条:
WFG版和Quantus版:
目前官网版:
3 个赞
WFG和skippy大侠都有修订,其中skippy大侠修订了大量外文部分的错误。他们肯定留有修订数据吧。
主要我还不会转换“生肉”啊,不然我就自己动手了。。。
1 个赞
需要最新数据的人,最好是使用《国语词典》的网站,反正是免费的。
国语词典
无法用代理去上网的大陆书友,就用Wfg的版本或本坛的版本。
有书友在百度盘提供wfg的《国语辞典》m-dict。
搬运wfg词典
执意要最新资料的m-dict的,可能得考虑自己动手。
我去下载了资料,看了一下,是某些书友最喜欢的格式:Excel资料档。因为太大,我的Openoffice在打开时冻结了。
https://language.moe.gov.tw/001/Upload/Files/site_content/M0001/respub/dict_reviseddict_download.html
我想Excel的数据应该是比较好处理的。
但是请注意Wfg做了什么:
於是取了官方公布的最後版本「dict_revised_2015_20160523」的數據,重新製作一部《教育部重編國語辭典(第五版)》離線辭典。
這次的製作因為已是第二次,嚴謹度更勝從前。把舊的圖片字對照表重新核對了一遍,多有修正,然後將大部分的缺字都自行造字,補進「全宋體」的補充字之中【註①】,並將所有資料都處理成純文字【註②】。
我曾經列舉的瑕疵與錯誤,官方數據幾乎都修正了,但還是有些我無法一一列舉的錯誤,官方沒有改到。例如:「琉璃球兒」條, “一” 字誤植為注音符號的 “ㄧ”;「調號」條,符號 “-” 誤植為注音符號的 “ㄧ”[/color]
(略)
網路第五版不知何故將第四版原有的 116 條「辨析」資料全數刪除。我個人認為這些「辨析」資料仍甚有參考價值,故從第四版數據中將之抽出,仍補入第五版之中。以 辨 標示,並加襯灰底,以提醒使用者注意這並非第五版的原生數據,特地補入只為方便對照參考。
得替换图片字,不是直接把资料弄成mdx就可以。
Wfg修正了官网的一些错误,有的小错误没有回馈给官网,所以仍然留在官网上。
Wfg还保留了旧版的一些有用资料,没完全跟随新版。
不容易啊,怎样做到这个水平?得花多少时间?
《国语词典》有15万多条,接近半部《汉语大词典》。这是一部大词典。
1 个赞
辞典免费,这一点大陆还是得向台湾学习
多谢,终于又看到音频材料了
1 个赞