汉语成语源流大辞典 修订版

您好,仁兄,能否分享一下pdf?

来晚了,PDF能再分享一下吗,非常感谢!

您好。请问您的网盘中有mdd格式的文件有三个,mdx有一个。三个mdd格式的文件有什么不同?普通读者,需要都下载下来么?

K大作品。
图片不重要,有无均可。
MDX是必须的。
几个MDD都是图片包。除了65M那个不算重要,其它两个MDD是必须的。建议都下载下来。

请问500M左右pdf 或 mdx,以及校订后的文字版还有可用的下载吗?

目前只找到上G的mdx + mdd。

最近搬数据,上G的文件搬来搬去还是太慢了,还是小点好。 :sweat_smile:

這涉及到版權,我有點不明白,出版方公開文字的理由何在?除非成了公版。

[/quote]您好。請問,這《 汉语成语源流大辞典修訂本》PDF完成了麼,如已完成,能否分享?先謝謝了。

本论坛绝大多数词典都同样有版权,而且它们的文本通常也不是网友OCR得到的,来源只能是出版方自己以各种形式自行释放发布。

在数字化时代,担忧盗版、侵权等不释放电子文本也很好,自己留着,别人只是不用少用而已。信息早已泛滥和过剩,不管少了谁大家都能过。

距我原始评论现在已经一年过去了,起初那些雄心勃勃要OCR、文本化这本词典的网友干得怎么样了呢,其数字化的文字是否已经达到合格、可用的状态?

我并不是说想打击别人的积极性,越愿意自己动手的人越多越好,但无论做什么事情,都要对当下的技术条件,自己的能力和水平,耐心,愿意付出的精力和时间等做出切实的评估,然后再筹划行动,才会比较妥当现实,而不是空怀壮志,三分钟热情,开一堆无法兑现的空头支票。

1 个赞

OCR、校对一本500万字,2500页的大书(词典)之前,可以先尝试自己动手从头到尾OCR、校对一本250页10万字的书,且这本书的文字、格式不能太简单容易。多做几次,经验丰富了,才能比较正确地评估技术可能性,自己的水平/能力,和持续用爱发电付出的恒心,不然很多时候只是看人挑担不费力。

1 个赞