Hycyyl大辞典研修版-七夕节版

hycyyl大辞典研修版-七夕节版

《汉语成语源流大辞典》(修订版)是学者用的学术性成语词典,不适合学生用来应试。我不鼓励大学以下的同学使用。这里发布的是一个改版,技术限制下载,无法解开文件的请使用原版。这个版和原版相比,所增加的资料并不多。

最初,pdawiki的K大做了《汉语成语源流大辞典》图像版的mdx。K大的图像版mdx多数是自己买书来扫描图像的,做词头索引也要费许多功夫,厥功至伟。

然后,iii_1优化了K大图像版的图像,用百度高精度ocr做了ocr。接着做了每页有词表的图像版mdx,这种图像版mdx像双层文字pdf,文字可以复制。可复制的文本是ocr文本,这个ocr文本又另外做成了文字版mdx。这是可歌可颂的、有开创性的工作。

上述mdx的来源见:汉语成语源流大辞典校对

iii_1图像版的词头是基于K大版的,但是大概用了旧的部件检索,把K大版一些正确的的Unicode汉字改成了私用字。另外,HYCYYL_0045——HYCYYL_0065的成语列表没有做出来,跳转也缺失,导致这些页面的词条查不到。

我把私用字改回Unicode汉字,补上了HYCYYL_0045——HYCYYL_0065的数据。另外改正了K大版原来的错误词头。我改了文字版的ocr错误,不过图像版的ocr文本就没改。

文字版的ocr错误还得校改很久,但是图像版既然已经改完,就先发布出来。

档案一共两层包裹,第一层是加密的zip文件,解开后得到mdd,再用mdxexport解开mdd,得到两个文件:yuanimg.mdx、yuanimg.css。仍旧用iii_1图像版的mdd。

qixi.zip

配图

[qixi.zip|attachment](upload://824M8ScqQKXGBpzcN4XFPQ1zIee.zip) (15.9 MB)

1.qixi.zip

解压密码是和七夕节有关的食品。

提示:清明节吃青团,冬至吃餃子,七夕节吃什么?两个汉字。《东京梦华录》称这种食品为“笑靥儿”。

因为密码只能使用英文,所以采用这种食品的汉语拼音当密码,字母相连,无调号,一共七个英文字母,第四个字母和第七个字母相同。

2.qixi.mdd
解开qixi.zip后会得到qixi.mdd。用mdxexport解开mdd。工具和使用方法见:《新手指南:怎样编辑mdx?》

解开qixi.mdd会得到两个文件:yuanimg.mdx、yuanimg.css。仍旧用旧版的mdd。

iii_1版文件(排除原css和原mdx)
汉语成语源流大辞典(修订版,商务印书馆,2023).1.mdd
汉语成语源流大辞典(修订版,商务印书馆,2023).2.mdd
汉语成语源流大辞典(修订版,商务印书馆,2023).3.mdd
汉语成语源流大辞典(修订版,商务印书馆,2023).4.mdd
汉语成语源流大辞典(修订版,商务印书馆,2023).jpg
汉语成语源流大辞典(修订版,商务印书馆,2023).mdd

把“汉语成语源流大辞典(修订版,商务印书馆,2023)”改成“yuanimg”,注意,“.X”号码不能改。

改完后:

我的文件(在zip内的mdd内)
yuanimg.mdx
yuanimg.css
+
原版文件
yuanimg.mdd
yuanimg.1.mdd
yuanimg.2.mdd
yuanimg.3.mdd
yuanimg.4.mdd
yuanimg.jpg

词典截图:

原书错字标示:
原书错误(红字)[校正:绿字]

补充:

iii_1原版文件见24楼

解开zip和mdd的工具可以参考14楼的帖子

14 Likes

iii_1图像版的文件已经过期,假如没有iii_1图像版的mdd,这个mdx是不是就没用了?

可以用这个yuanimg.mdx配K大原版的mdd,但是得多花一些功夫。

iii_1图像版是基于K大原版的,所以图像名字相同。

但是iii_1优化了K大原版的图像,存为png,而K大原版的图像是jpg,只有这一点不同。

只有K大原版的mdd的书友,有两种方法可以利用这个yuanimg.mdx。

1.用mdxexport解开yuanimg.mdx(我特地用Unicode 8编译,mdictutil也能打开的)。

用Emeditor打开yuanimg.txt,把png替换为jpg,保存。

然后用mdxbuilder重新编译yuanimg.txt为yuanimg.mdx。

配上K大原版的mdd,就可以用了。K大原版的mdd需要改名,方法参考上面的例子。

汉语成语源流大辞典 修订版.jpg
汉语成语源流大辞典 修订版.mdd
汉语成语源流大辞典 修订版.1.mdd
汉语成语源流大辞典 修订版.2.mdd

把“汉语成语源流大辞典 修订版”都改成yuanimg,“.x”的号码不能改。

2.假如不改mdx,就只能改mdd。把K大的mdd解开,优化jpg,重新存为png,然后重做mdd。

1 Like

shaoshi老大,您好,iii_1的mdd已经失效无法下载,能不能再指一下路,感谢

使用K大版的mdd替代,方法见二楼。

补充:

能用123盘的书友可以用24楼的iii_1版的mdd。

只能用百度盘的,可以用K大原版的mdd。9楼有一个百度盘的K大版黑白两色mdd,限期下载。只有正文图像,缺辅文图像。

好的,我手太笨,mdx重新编译后,可能哪个地方没有处理好,在dicttango上格式丢失,也能用

谢谢分享!!

这回弄好了,再次感谢shaoshi老大

yuanimg.mdx (15.9 MB)

本人曾分享过一个压缩的mdd,1.27G大小。图像压缩了但清晰度提升了。刚刚试过,完美匹配shaoshi先生新发布的mdx(当然也需要改一下名)。文件这么大,也只能通过百度云再次分享一下,分享期30天。链接: https://pan.baidu.com/s/19QGtGZcYmcaFVKJXxRPcPQ?pwd=vte7 提取码: vte7

3 Likes

其实压缩包密码可以用中文的,直接复制粘贴进去就可以

我搞技术限制下载,不是想逗着新手玩,主要有以下目的:

1.限制传播,只让圈内人用。

2.激励新手学习一点技术。

改了mdx重新编译,比较困难,你改了mdx再发出来,也就算了。

但是css就删掉,别发了,让新手自己学习用mdxexport解压mdd。到原压缩档里去找。别剥夺新手学习的机会。

还是用英文比较保险。中文有不同编码的。

2 Likes

不好意思,下次一定注意

1 Like

zip文件,pc端解压出错,android能解。 mdxexport解不开mdd,提示内存不足,奇怪 :innocent:

解压用7zip。

7zip
https://www.7-zip.org/download.html

要解开mdd,除了mdxexport,还可以用GetDict

更小众的工具还有:

SourceEditor

可以不解压整个mdd,只提取单一文件。

“把K大版一些正确的的Unicode汉字改成了私用字”
“我把私用字改回Unicode汉字”

最後是改成私有區字,還是相反?可以舉例嗎?

1 Like

像这种情况。

图像版
뗧–>餗
뛳–>鵩
߃足适履–>𠟃足适履
ൾ然大笑–>𠵾然大笑
⠵然自失–>𢠵然自失
㧗–>𣧗
꘏꘏廉谨–>𪘏𪘏廉谨
南蛮뛞舌–>南蛮鴃舌
뛞舌–>鴃舌

改成Unicode繁体字,不用类推简化字。

我不管什么全宋体,反正我不用私用字。

上述都不是部件檢索用的編碼。像뗧、뛳是韓文,不是PUA。

那我就不知道是怎么弄成这样的。这些有问题的词头,K大的原版是正确的。

不会是程式制造出来的乱码吧?

反正我用数据库比较了,改正就是了。

嗯,既不是PUA編碼範圍,又不是有意用的,等於是亂碼。

1 Like

配合楼主mdx大体可用,但序言、修订说明、凡例等正文前的辅文不能显示,是mdd优化时删去了吗?