嗯。0.0
导出后一张图片约4000*6000,灰度,4M+。
缩小到40%,4色,大小约250-300K。
缩小到25%是没问题的。不想重弄了,就这么来了。反正不差那点空间。大点没事。
抛砖引玉,供参考:
第一点,提取图片(可辅以适当的文件重命名)后用老马的软件 strnghrs - 博客园 批量处理正文部分。如果有纸本对照更可以按照纸本设置页面排版及边距。如果没有,则可自行设置,并将正文图像设置为靠上,以及取决于奇偶页面设置靠左/靠右,好像还有溢出和放大,以令图像锁定在设置的画框/内容框内。
曾在一篇英文帖子中写过大致思路,不过现在看来当时的成品效果可以更有改进:
也别说自己是否是小白,我们都是从小白过来的。
第二点,可参考近期论坛中读秀资源相关内容自行搜索存货情况,并查看存货文件中是否均缺少特定页面。如果确认其中是缺少且无文献传递/互助服务,可自行寻找纸本扫描/拍摄并处理成适合阅读的图像。
这个缺的页面是存货文件中包含的还是后期添加的?
缺失~~
为了书签跳转正确,特地添加。
弄完啦。
楼主前面说错了。缺失的是2120和2121页。嗯。我偷懒复制粘贴结果也是出错。。。
P2120为空白页,并不存在缺失。
真正缺失的是P2121页。
我没有见过真正的原书,依照既有的页码,找不到P2120和P2121,所以暂且判定是缺这两页
你处理的书的效果都很高。我建议分辨率尽量不缩小,因为显示设备的分辨率是在不断提高的,现在4K已经普及,未来也许8K也没问题。所以建议尽量保留高分辨率比较好,存储空间真不是啥事。
大赞!感谢补缺页
不用谢,就搬个运
这上传速度真很那个啊~~
稳得很啊!每秒就40K前后!这东西传上去真费时间
https://cloud.freemdict.com/index.php/s/nG7CbFtorTxGMgo
非常感谢!其实太麻烦就算了,我怕太麻烦别人。我对资源的态度向来是随缘,有固然好,没有就用别的。
jcz777兄真是少有的热心人啊。
等我得空时,研究一下这书能不能ocr了做词头。还没见过这书的索引。
汉英词典的词头可以和汉语词典互相参照,是有用的。英语词典我就不研究。
有时候,汉语词典的词头反而有些滞后,汉英词典提前收录了该收的词头。
有的汉英词典似乎是不管汉语词典的词头的,导致收录了错误的词。但这本词典应该参考了《现代汉语规范词典》或《现代汉语常用词表》的词头,这是可贵的。
如果只是切边,Acrobat就行,文件也不会变大。另外,2021页不缺,是中卷正文第1页。
再次感谢jcz777兄。已经下载完毕。
第一次见过此书图像版,长得真像《汉英大词典》,内容也有许多相同吧?难怪会引起法律纠纷。
这个ocr,效果大概不好。
多年前有个叫nciku的网站,有《现代汉语规范词典》和这部《汉英综合大辞典》,不过网站昙花一现,后来消失了。
网上有人发过一个从nciku摘录的《汉英综合大辞典》资料,当然,没多少条。我刚才想起来,查了一下硬盘,现在把这个文本发上来。这个对我而言无用,也许对某些书友有用?
nciku.rar (1.9 MB)
这个文件,就76418词条。离34万词条差太远了。
这个是学习汉语的外国网友按自己需要摘录的,所以有同样需要的网友可能会觉得有点用。
这34万条,大概有不少是和《汉英大词典》相同的,所以才会引起法律纠纷。
雷同的部分,其实用《汉英大词典》就好了。要是能找到不同的部分,ocr了弄出来,倒是有用,但是不容易做到。
做完了《汉英综合大辞典》的ocr,效果很差。
6000多页的pdf,finereader用掉了100多g的硬盘空间还没打开完,就报告硬盘没有剩余空间了,放弃。
被迫学新技能,找了个免费软件:
Pdfsam
用Pdfsam先把6000多页的pdf拆成三个,然后一个一个弄。
我发现我从N-ciku复制来的部分《汉英综合大词典》内容,和这个《汉英综合大辞典》完全不同。
真可惜啊,n-ciku那本有可取之处,这本我看了却不太喜欢。
看看这一条:
“破涕为笑”的【近义】是“破涕为笑”?
虽然我对《汉英大词典》的校对疏漏早已见怪不怪,看到这个还是要吐槽。
花了两周时间,终于完成了这项磨人的工程——6000余页的纯手工纠偏对齐,删除了附录中的花语部分,添加了详细导航目录。文件总大小760MB