分享一套来自读秀库的pdf三卷本《汉英综合大辞典》,为优化阅读效果,求助高手对其进行处理:①批量对各页面进行上下左右的对齐居中,给正文内容四周留出等距白边;②补充中卷缺失的2020~2021页
非常感谢,很清晰
求一款适合电脑小白的批量白边裁切工具
弄完后可以发在本坛的云盘吗?
这本词典过去有网络版,我用过。英译不是太高明,但有一个优点,就是吸收了《现代汉语规范词典》的词头,也就包括了《现代汉语常用词》的词头。
为什么文件会在处理后变大?-_-
嗯。0.0
导出后一张图片约4000*6000,灰度,4M+。
缩小到40%,4色,大小约250-300K。
缩小到25%是没问题的。不想重弄了,就这么来了。反正不差那点空间。大点没事。
抛砖引玉,供参考:
第一点,提取图片(可辅以适当的文件重命名)后用老马的软件 cnblogs.com/stronghorse 批量处理正文部分。如果有纸本对照更可以按照纸本设置页面排版及边距。如果没有,则可自行设置,并将正文图像设置为靠上,以及取决于奇偶页面设置靠左/靠右,好像还有溢出和放大,以令图像锁定在设置的画框/内容框内。
曾在一篇英文帖子中写过大致思路,不过现在看来当时的成品效果可以更有改进:
也别说自己是否是小白,我们都是从小白过来的。
第二点,可参考近期论坛中读秀资源相关内容自行搜索存货情况,并查看存货文件中是否均缺少特定页面。如果确认其中是缺少且无文献传递/互助服务,可自行寻找纸本扫描/拍摄并处理成适合阅读的图像。
这个缺的页面是存货文件中包含的还是后期添加的?
缺失~~
为了书签跳转正确,特地添加。
弄完啦。
楼主前面说错了。缺失的是2120和2121页。嗯。我偷懒复制粘贴结果也是出错。。。
P2120为空白页,并不存在缺失。
真正缺失的是P2121页。
我没有见过真正的原书,依照既有的页码,找不到P2120和P2121,所以暂且判定是缺这两页
你处理的书的效果都很高。我建议分辨率尽量不缩小,因为显示设备的分辨率是在不断提高的,现在4K已经普及,未来也许8K也没问题。所以建议尽量保留高分辨率比较好,存储空间真不是啥事。
2020是空白页,2121如下
2121.pdf (103.8 KB)
大赞!感谢补缺页
不用谢,就搬个运
这上传速度真很那个啊~~
稳得很啊!每秒就40K前后!这东西传上去真费时间
https://cloud.freemdict.com/index.php/s/nG7CbFtorTxGMgo
非常感谢!其实太麻烦就算了,我怕太麻烦别人。我对资源的态度向来是随缘,有固然好,没有就用别的。
jcz777兄真是少有的热心人啊。
等我得空时,研究一下这书能不能ocr了做词头。还没见过这书的索引。
汉英词典的词头可以和汉语词典互相参照,是有用的。英语词典我就不研究。
有时候,汉语词典的词头反而有些滞后,汉英词典提前收录了该收的词头。
有的汉英词典似乎是不管汉语词典的词头的,导致收录了错误的词。但这本词典应该参考了《现代汉语规范词典》或《现代汉语常用词表》的词头,这是可贵的。
如果只是切边,Acrobat就行,文件也不会变大。另外,2021页不缺,是中卷正文第1页。