这么有兴趣?是专业研究,还是业余爱好?
pdawiki可以每日签到,以增加积分。
本坛有很多人有pdawiki账号的,但我估计没多少人对这个有兴趣,所以也不会去联络K大。因为pdawiki差点被完全封掉,不敢再做mdx,所以K大是有可能把旧作放到网盘去的。
这么有兴趣?是专业研究,还是业余爱好?
pdawiki可以每日签到,以增加积分。
本坛有很多人有pdawiki账号的,但我估计没多少人对这个有兴趣,所以也不会去联络K大。因为pdawiki差点被完全封掉,不敢再做mdx,所以K大是有可能把旧作放到网盘去的。
自從「國學數典」以後已經幾年沒玩過每日簽到了。
我是古代漢語辭典重度使用者,沒了「國學數典」以後有問題也沒處提出了。(話說有位先生每回都拿故訓類辭書上的材料回覆我與別人,他提供的都是我已查找並覺得不可用的。但沒了「國學數典」連這種浮面交流亦不可得。)常常在《漢語大字典》第二版、《漢語大詞典》找不到答案時,就往它們以前的字典翻,從《正中形音義大字典》、《三民大辭典》一路到《故訓匯纂》、《經籍籑詁》、《康熙字典》。
本坛也可以讨论国学的,帖子发在“词典与语言学习”分类。但爱好者不多。
本坛有书友自建的古籍全文檢索
也有繁体的《四库全书》文本。
词典的释义只能作为思考的起点,得再查原典。
字多当推《汉字海》。但据说问题不少。
我没下载。这是安娜馆的文件报告。说是有394页受影响。不是第394页有问题。
安娜馆大概是用程式比对原书页码和现存pdf页码的。
正文未必有问题。也可能是附录不见了。
不算最后的安娜转换log页,一共2124页,正文2058页,附录有三个。394页有问题,就是有将近五分之一,从前到后随机看了50页,没有一页有问题。
你得看目录比对一下,才能知道有没有缺页。我没书,所以无法知道。
有时某页可能在,但是会有黑线。
要是图像没缺,不必向K大要,自己也能做mdx的。
对照目录,数量上没有缺页,安娜转换后是按照pdg的文件名命名页码名称的。acrobat缩略图页面从前滚到后,没看到黑线或页面内容缺失。
尝试做了一页二值化,缩放到200,效果也不太好,为了避免笔画不黏连,还是会造成笔画缺失,还是请高手出手吧,我放弃了。
(帖子已被作者删除)
早上6点多用慢速链接2下载,排队等360秒,自己刷新页面,复制链接到FDM,开始下载。应该是加速度,可以达到4-6mb一秒,几分钟就把这个将近1G的大块头下载完了。
暂时未发现缺漏。
确实有参考价值。我准备根据索引重做mdx。mdx可以发出来,但是mdd这么大,不可能上载。
书前对《康熙字典》各种版本的说明非常清楚,值得细读。
感谢分享。这个速度太夸张了!alexpeng是百米賽选手?
解开mdx看了一下:
Description:
klwo2@pdawiki
原来alexpeng收藏了K大原版?
好像只能输入注册码才能查看。
一覺醒來,準備歡慶中秋節,迎來的是2008年社會科學文獻出版社王宏源的《康熙字典》mdx、mdd,美夢成真,這中秋節太幸福了,十分感謝alexpeng先生!
經過昨晚初睹2015年版,我想講些觀察,以中和klwo2的批評。
一、王宏源在頁II「銘謝」稱2015年版與2008年版是姐妹作,兩書密不可分。所以2015年版不可以看成是2008年版的新版並取代2008年版。
二、2008年版將王引之、渡部溫、編者本人的糾謬,附在字條之末。2008年版是按道光本,所以正文已是王引之改過的,2015年版則將渡部溫、編者本人的成果逕改入正文。
例證:2008年頁2「丈」的「屬聚下役」,渡部溫校出「下」爲「丁」誤,2015年頁2逕改爲「丁」。
又:2008年版頁1「丁」下的「吉丁」是蟲名,《本草註》說人會抓這種蟲,「令人喜好相愛」。王宏源校出此句後有「媚藥也」而原本未引,致文義未足,2015年版頁1便加上去。
但也不是全盤接收的改,例證:2008年頁1「一」《說文》「惟初大始」的「始」,渡部溫引據段玉裁注本作「極」,2015年未改。(考大徐本作「太始」,小徐本作「太極」,段注本作「大極」,沒有一個作「大始」的。)
三、2008年將王力對於音切的糾正附在各音切之後,由於那是各家韻書之錯,而非《康熙字典》抄錯字,且王力並沒說正確音切該作爲何,所以2015年版無從改之,並將王力的部分全都拿掉。這做法可惜嗎?我不知道。
四、字條之下如有「瀚堂」二字合文,就是增補,收錄了學者研究。
例證:頁19「亟」有「詐欺」訓,下引華學誠(現任北京語言大學人文學院院長)之說,講此訓致誤之由。
五、原字頭用《康熙字典》的字型,新增字頭用電腦字型,一目瞭然,容易分辨。
六、新增字頭若有古代或現代的訓、例,則皆有。
例證:頁4有兩個「丟」字,前一個是舊字體,第一筆是一橫,第二個是電腦字體,第一筆是左撇。第一字條文是《康熙字典》之舊(含華學誠對引書之糾謬),第二字條文是編者輯錄的,並糾正第一條所云之誤。
還有一報紙例句是亂翻看到的,現在翻檢不出,字頭是日本和字,用作日本軍人姓名,他遣人祭拜奉化蔣家墓,因此沒列入甲級戰犯,文章作者特此抗議。此書證挺有趣。
七、比其他辭書更多的內容。
例證:頁42「俤」是日本和字,釋義和梁啟超例句引自《漢語大字典》第二版(含頁碼),但還有:「《越諺》:俤俤,貼近切,弟也。」非來自《漢語大字典》第二版。
小結:我滿肯定2015年版增修、訂正《康熙字典》的努力。
KXZD2008.7z (5.6 MB)
百尺竿头?(看了是全文数据,但缺字可能比较麻烦。)
将现有资料一并上传至:
说明:
1.pdf来自DX扫描档案(klwo2制作的mdd也源此)。
2.随书光盘为2008版附带光盘,但需填写注册码才可解锁全部功能。因注册服务器关闭,目前已无法直接使用。但——
3.光盘内可直接复制读出《字典》词条内容,即链接内KXZD2008光盘文本.7z,然而包含大量缺字,需研究处理。
4.klwo2制作的mdx是否可配合光盘文本字头编号使用?未研究
这个2008王宏源版《康熙字典》,有原文,有校订,大概是目前最好的「真本」《康熙字典》(无删削涂改)。
有心者可利用以上材料整理一番。
我试了两个方法:
1.打开白石发的文件。
2.用7zip打开setup.exe,找你说的文件,再解压出来,将后缀改为txt。
不管用哪一种方法,用Emeditor打开都会显示为乱码。换编码也不行。
我猜测Win 10认不得旧的Gb编码。
你能不能帮忙把文本存为Unicode 8,再压缩了传上来?