【已解决】《汉英综合大辞典》扫描版的后期处理

再次感谢jcz777兄。已经下载完毕。

第一次见过此书图像版,长得真像《汉英大词典》,内容也有许多相同吧?难怪会引起法律纠纷。

这个ocr,效果大概不好。

多年前有个叫nciku的网站,有《现代汉语规范词典》和这部《汉英综合大辞典》,不过网站昙花一现,后来消失了。

网上有人发过一个从nciku摘录的《汉英综合大辞典》资料,当然,没多少条。我刚才想起来,查了一下硬盘,现在把这个文本发上来。这个对我而言无用,也许对某些书友有用?

nciku.rar (1.9 MB)

这个文件,就76418词条。离34万词条差太远了。

这个是学习汉语的外国网友按自己需要摘录的,所以有同样需要的网友可能会觉得有点用。

这34万条,大概有不少是和《汉英大词典》相同的,所以才会引起法律纠纷。

雷同的部分,其实用《汉英大词典》就好了。要是能找到不同的部分,ocr了弄出来,倒是有用,但是不容易做到。

2 个赞

nciku.7z (3.4 MB)
加了点非常简单的样式,基本上能用。

3 个赞

做完了《汉英综合大辞典》的ocr,效果很差。

6000多页的pdf,finereader用掉了100多g的硬盘空间还没打开完,就报告硬盘没有剩余空间了,放弃。

被迫学新技能,找了个免费软件:

Pdfsam

用Pdfsam先把6000多页的pdf拆成三个,然后一个一个弄。

我发现我从N-ciku复制来的部分《汉英综合大词典》内容,和这个《汉英综合大辞典》完全不同。

真可惜啊,n-ciku那本有可取之处,这本我看了却不太喜欢。

看看这一条:

potiweixiao

“破涕为笑”的【近义】是“破涕为笑”?

虽然我对《汉英大词典》的校对疏漏早已见怪不怪,看到这个还是要吐槽。

花了两周时间,终于完成了这项磨人的工程——6000余页的纯手工纠偏对齐,删除了附录中的花语部分,添加了详细导航目录。文件总大小760MB

2 个赞

楼主辛苦啦……这工程量简直庞大……

请问楼主是否是自己扫描的?分享的这些字典原版600dpi未切边的版本也能发一份,还是喜欢比较看带白边的版本,看着更有实体书的味道。能的话,在此先谢过了!

书不是自己扫的,源文件来自读秀,楼上有链接

1 个赞

请问最终链接是哪个,谢谢

没看到最终链接啊?

1 个赞

百度网盘 请输入提取码 提取码: ghfp

已补档,及时查收

收到,非常感谢!!

1 个赞

附上自制图标一枚:
现代汉英综合大辞典
小篆“今”,取自峄山碑;以汉字“今”所指“现代”义与“A”型符号假喻“汉英联结”;“今”字用旧纸书颜色,图的底色是剑桥在线词典官网主题色。

请参看效果图:

这本词典有mdx版吗,不是只有扫描版pdf吗

Acrobat 怎么切边的?

这个百度链接过期了,可以补链吗? :heart:

过去太久了忘了。Acrobat处理一两张还行,批处理还得用专业的软件。

1 个赞

链接: 百度网盘 请输入提取码 提取码: b4ss

2 个赞