《汉语方言大词典研修版》

《汉语方言大词典研修版》

最初,K大用知网文字版的词头做了一个图像版。词头缺字、错字的情况和知网版相同,所以我知道是知网版的词头。

klwo2:汉语方言大词典(许宝华)破罐子破摔版
1.这书的PDF至少出了10年了,一直没人做mdx;
2. 这书生僻字特别多,还有乱七八糟的类推简化字。20万词当中,大概有1万多个词处于残废、乱码状态
3. 我批量改了一大堆数据源里面的问题,剩下的实在没心思改
4. 现有的版本也不坏,至少能看到18万正常词呢
https://061061.xyz/37645.html
按:K大的原帖是有百度盘链接的,可以在那里找mdd。

然后,leescott改进了K大版,替换了许多图像字,还剩下大约4000多个图像字。

leescott:汉语方言大词典–许宝华(切图版)
https://061061.xyz/47214.html

我奋战了许久,终于把剩下的图像字都替换完毕,另外改了几个错字,补了几个脱漏的词。

我修改了K大版的mdx,词典名为“汉语方言大词典研修版”。文件名为fangyan.mdx。仍旧用K大的mdd。mdd见下帖。下载后清将mdd改名为fangyan.mdd。

Index of /尚未整理/06mdict/漢語方言大詞典[許寶華]/

点击打开上面的Index链接后,找到这个链接:
Index of /尚未整理/06mdict/漢語方言大詞典[許寶華]

点按链接进入资源库,下载这个文件:
漢語方言大詞典.mdd 02-Nov-2020 16:20 1103496325 B / 1.03 GB / File Hash
然后把“漢語方言大詞典.mdd”改名为fangyan.mdd,和fangyan.mdx放在一起。

假如百度盘也不行,资源库也不行,那么去安娜馆下载一个pdf,配合mdx用吧。

Chinese [zh], pdf, 621.0MB, Book (non-fiction), 汉语方言大词典_phlins_collection.pdf
汉语方言大词典 全五卷
中华书局, 汉语方言大词典, 1, 1999

这是1999年的旧版,而且图像不够清晰。《汉语方言大词典》(修订本)在2020出来了。需要修订本的自己去买纸本,需要新版高清本的自己扫描。现在已经是资料共享的黄铜时代了,黑铁时代都快来了。不必指望看到新版的mdx了,我认为不会有了。这个残缺不全的旧本需要大家多年接力奋斗,才能做到这个还不完善、但比较好用的程度。知足吧。

二十多万个词条的大词典,其电子版一定会有错漏。不可能通校,错误只能在使用中发现。欢迎大家报告缺字、漏字、错字,但是我不一定会再改,大家可以自己改。

下载:fangyan.zip,7mb

[fangyan.zip|attachment(upload://nufFAWbAEIOl83U9cUyHJIvhcG6.zip) (7.0 MB)

22 个赞

已知问题举例:

1.有一码多字的情况,有些词条的字会替换错。

2.词头有ocr的错误,例如“冇”字常误为“有”字。看到“有”字须对一下图像,看有没有错。

3.有掉词的情况,例如“曱甴”,图像有,词头掉了。

假如发现这类错误,请报告。

1 个赞

万分感谢楼主的治学精神和无私奉献!

1 个赞

书友发现掉了的词,可以直接在此帖中反映。请不要发私信。我不爱看私信。

“燍气”是知网也掉了的词。这种情况一定还有。累积多了再补吧。

这么大的书没办法通校,问题只能在使用中发现。

感谢196691997书友报告:

6-1-2024
燍气 (U+71CD U+6C14)|7286

2 个赞

文字版 阿弥陀佛 已经在制作中,将于近期面世,您届时可根据图像版完善一下。

8 个赞

功在论坛,利在学界。 :smile: :rose: :heart:

1 个赞

期待中啊!!!

您替换了leescott剩下的那4000多个图像字,给这个1999年的旧版画上一个圆满的句号,也很了不起了,《汉语方言大词典研修版》至此成为旧版的定本,研修版已经完全可以取代K大的图像版,leescott切图版仍然有独立存在的价值(可以在手机上用)

1 个赞

除了图片清晰度欠奉,这个《汉语方言大辞典研修版》没别的毛病 :wink:

这个词典不如果是按古音来说方言啊!那佷合我心意,强烈期待下你的文字版。

1 个赞

陀佛哥,既然能有文字版,能否请您再制作一个《汉语方言大词典》反查版呢?我觉得这是更能解决研究者痛点的版本。假设我已经知道有这么个方言词a,那么通常情况下a的意思其实我也是知道的,犯不上专门去查方言词典;更多的情况是,我想知道普通话里的某个语词,在各地方言里都是怎么表达的,分别对应于哪些语词,这个查阅需求更加真实而普遍,《汉语方言大词典》反查版就能解决这个问题

3 个赞

如果文字版质量可以,我来做反查。

1 个赞

有没有我QQ,2857918904,或邮箱,我把 汉语方言大词典 原数据发给你,你来做MDX 和反查吧

2 个赞

:v: 赞!原数据来了,mdx还会远吗?

已加,请通过

不会太远,但可能还得解密

来源是需要解秘的?那质量可能更高啊。

而且这样一来,图像版词头的来源和文字版就是两种不同数字版本,可以互相查漏补缺。 :heart:

这个弄出来,是重量级mdx啊。

可以有很多衍生品。比如把单字抽出来,成为《汉语方言大字典》。

比如把某种方言抽出来,例如《粤语大词典》。

現代漢語方言大詞典(反查 & 同義詞) by Robot 2019-10 里的数据不知来自什么地方……,好像也没看到这本的正查。

不完美文字版

非常期待。新年非常期待。