【已解决】《汉英综合大辞典》扫描版的后期处理

分享一套来自读秀库的pdf三卷本《汉英综合大辞典》,为优化阅读效果,求助高手对其进行处理:①批量对各页面进行上下左右的对齐居中,给正文内容四周留出等距白边;②补充中卷缺失的2020~2021页

5 个赞

非常感谢,很清晰

2 个赞

求一款适合电脑小白的批量白边裁切工具


0.0
嗯。处理完一个页面近300K,预估重新生成PDF后得两个G。。不想跟眼睛为敌,就这么来。

还没下载完!百度网盘就那个速度。

弄完后可以发在本坛的云盘吗?

这本词典过去有网络版,我用过。英译不是太高明,但有一个优点,就是吸收了《现代汉语规范词典》的词头,也就包括了《现代汉语常用词》的词头。

2 个赞

为什么文件会在处理后变大?-_-

嗯。0.0
导出后一张图片约4000*6000,灰度,4M+。
缩小到40%,4色,大小约250-300K。
缩小到25%是没问题的。不想重弄了,就这么来了。反正不差那点空间。大点没事。

抛砖引玉,供参考:

第一点,提取图片(可辅以适当的文件重命名)后用老马的软件 cnblogs.com/stronghorse 批量处理正文部分。如果有纸本对照更可以按照纸本设置页面排版及边距。如果没有,则可自行设置,并将正文图像设置为靠上,以及取决于奇偶页面设置靠左/靠右,好像还有溢出和放大,以令图像锁定在设置的画框/内容框内。

曾在一篇英文帖子中写过大致思路,不过现在看来当时的成品效果可以更有改进:

也别说自己是否是小白,我们都是从小白过来的。

第二点,可参考近期论坛中读秀资源相关内容自行搜索存货情况,并查看存货文件中是否均缺少特定页面。如果确认其中是缺少且无文献传递/互助服务,可自行寻找纸本扫描/拍摄并处理成适合阅读的图像。

这个缺的页面是存货文件中包含的还是后期添加的?

1 个赞

缺失~~
为了书签跳转正确,特地添加。

1 个赞

弄完啦。

楼主前面说错了。缺失的是2120和2121页。嗯。我偷懒复制粘贴结果也是出错。。。
P2120为空白页,并不存在缺失。
真正缺失的是P2121页。

我没有见过真正的原书,依照既有的页码,找不到P2120和P2121,所以暂且判定是缺这两页

2 个赞

你处理的书的效果都很高。我建议分辨率尽量不缩小,因为显示设备的分辨率是在不断提高的,现在4K已经普及,未来也许8K也没问题。所以建议尽量保留高分辨率比较好,存储空间真不是啥事。

2020是空白页,2121如下
2121.pdf (103.8 KB)

2 个赞

大赞!感谢补缺页

感谢!@王绍军

链接:百度网盘 请输入提取码
提取码:jnrv

1 个赞

不用谢,就搬个运 :grinning: :grinning: :grinning:

这上传速度真很那个啊~~
稳得很啊!每秒就40K前后!这东西传上去真费时间
https://cloud.freemdict.com/index.php/s/nG7CbFtorTxGMgo

3 个赞

非常感谢!其实太麻烦就算了,我怕太麻烦别人。我对资源的态度向来是随缘,有固然好,没有就用别的。

jcz777兄真是少有的热心人啊。 :heavy_heart_exclamation:

等我得空时,研究一下这书能不能ocr了做词头。还没见过这书的索引。

汉英词典的词头可以和汉语词典互相参照,是有用的。英语词典我就不研究。

有时候,汉语词典的词头反而有些滞后,汉英词典提前收录了该收的词头。

有的汉英词典似乎是不管汉语词典的词头的,导致收录了错误的词。但这本词典应该参考了《现代汉语规范词典》或《现代汉语常用词表》的词头,这是可贵的。

如果只是切边,Acrobat就行,文件也不会变大。另外,2021页不缺,是中卷正文第1页。