《汉语大词典》三卷本,哇呀呀

“又”字头的几个词(又且、又作別論、又及、又弱一个、又生一秦)本来应该指向0851.png,大概因为原图像缺下半部,所以改为指向补丁。假如替换了新的完整的0851.png,改为指向0851.png就行。

{足存}字改一下页码就行。

当然,我主要用自己的资料库,导入索引后,已经改了。我不常用mdict,只是发现了问题,就提出来讨论,提醒大家注意。

这些有“(”的字头我会查一下看是什么:劈(¥009)。可以借此机会稍作整理。

你用来做对比的是哪个mdict版的文字版?光盘2版还是3版?

我的版因为统一了异体字,应该不会有那么多差异。等清理完了再用Access的query查一查。

你列的图像版缺的词头,有些是《汉语大词典》光盘2.0自己加的,《汉语大词典》没有。光盘的编者把GBK汉字有而《汉语大词典》没有的字,收了一些进光盘。

光盘编者自己加的字,可以不管,假如要加进《汉语大词典》mdict,可以放在附录。

1 Like

下载到了,谢谢提示

不必客气。假如发现问题也请提出来讨论。借此机会整理一下数据。

应该是在你的提醒下以2.0为底本综合当时能找到的所有版本制成的。时间太长,都忘了

1 Like

查改这14个有“(”的字头,居然花了一个早上。把查改的结果上载于此,供书友参考。

suoyin-note.txt (1.3 KB)

1 Like

多谢,辛苦了!
漢語大詞典圖像版.1.mdd (163.6 KB)

1 Like

谢兄费心。这个补丁内只有一个H020851a.png,与原来只有上半部的0851图像对比,发现不是同一版本。这个H020851a.png应该和djvu同源,没有这样清晰。但是总算凑齐能用了。

有一疑问请教:我看到有书友说“订补二”,这是说《汉语大词典订补》出了第二个纸质版本,因此有另一个电子本,还是《汉语大词典订补》只有一种纸质版本,但是有书友做出了不同的电子本?

我没做过mdict电子书,向来只用getdict分解mdx。现在我假如要微调这个mdx的索引,再重新编译mdx,应该用哪个版本的mdx builder才能和Goldendict兼容?在哪里可以下载这种兼容Goldendict的编译器?

订补一和订补二是两本书:订补一有少许错误,去年做了一些勘误,但不彻底;订补二是我一页一页复制的,没多大问题。
mdx builder不用最新版,用版本3就能与gd兼容

不知道跟sxingbai的數據和不和。
訂補二.zip (364.0 KB)

1 Like

感谢Mastameta兄费心。所以这是sxingbai兄对自己的电子书的订补?

我有《汉语大词典订补》的纸质版,多年前又根据一个文本pdf导入资料库,似乎也不齐。最近看到有人说文本pdf是ocr的,不知是否如此。

在某处(忘了在哪里)又下载了一个mdx,可能就是sxingbai兄做的订补1,不过下载后并没有看。可以再研究一下。

订补是《汉语大词典》官方的订补,质量基本是可靠的,不是ocr,但有一些编码问题导致的错误,不算多。订补二是取自《〈汉语大词典〉研究》(商务出版社)中的订补部分。

1 Like

原来如此,感谢兄答疑解惑。书友的引用语焉不详,我还疑惑是否有一本新书。

《汉语大词典》光盘2只收Gbk汉字,所以都可以检索。

这个《汉语大词典》图像版则收了Unicode的汉字。我想Unicode汉字无法直接检索(我技术不好,听说专业的古籍资料库可以),所以在自己的资料库内,大概会做一个词条后面有U+xxx的索引。

然后遇到繁难字,用别的方法(部件检索之类,我自己另有汉字资料库)查到U+xxx,就可以再查《汉语大词典》图像版页码。

看这个如何?
汉大020851 (1700,2455)

这个和djvu不同源,但是是降低了画质的jpg。

我发现即使上载png,论坛的程式也会转换为jpg。

你假如有png,是否可以用附件上载?我下载看画质是否好一点。谢谢。

2 Likes

汉大020851 (1700,2455).zip (528.9 KB)
在我儿点上面的图片放大后也很清晰

1 Like

谢谢指点。这个很清晰,是同一个版本的,所以合为完璧了。你可真神通广大啊!

我第一次是用右键存档的,存了降低画质的版本。

你最后发的zip就是png,就更方便,直接改名复制进文件夹,覆盖原文件就行。

多谢费心。

这个论坛的AI管理员说我已经在这个主题发了38%的帖子,那是嫌我啰嗦了,就到此为止。

平典、深蓝都可以全文搜索

最近看到本坛书友介绍了GoldenDict 1.5版,发现这个版和1.0版最大的不同是可以搜索全文。

菜单多出了一个Search,试了一下,确实可以搜索全文。

GoldenDict 1.5
Early Access Builds for Windows
1.5.0-RC2-372-gc3ff15f
Date: 27 April 2019

2021年10月21日补充:

本坛像个宝山,宝山不是杂货铺,需要耐心和时间寻宝。缺乏耐心或没有时间的人,建议到隔壁去花钱买书。时间也是钱,要计算时间成本。

找不到正确链接的人,可以参考下列帖子的回答:

2 Likes

今日偶然在 @jcz777 的网盘里发现还有个汉语大词典更清晰的版本 @tzhyun @shaoshi ,还是透明背景图片,只是文件有点大,两个mdd加起来6G多,下面是和原来的那个3.45G的mdd的截图对比:

image

image

image

只是这个mdx有问题,本身这版的mdd就含有020851这一页的完整图片,mdx解包后发现“又”所在页面指向了0851a.png这一不存在的图片,导致图片显示不出来,而且这一页的词头都单独指向了0851a.png,索性自己动手把这一页的词头做了修复:

汉语大词典 2008 整页图像 修正.mdx (2.7 MB)

这个索引也是繁体词头,和原书一致。虽然很多软件支持简繁通搜,只是这本词典收的字词太多,感觉是不是也有必要做一个繁简通搜版?隔壁有个帖子在对康熙字典加简体索引时,写过这条理由:

image

1 Like

请问这个jcz777网盘在哪里?很想保存这个高清版的汉语大词典

就在楼上我发的链接里

1 Like