英语辨析大词典 徐钟等 2003 扫描本 || 1.4GB vs 400MB 文件质量讨论

之前一篇求新读秀资源的帖子跟帖跑偏越来越严重:求《英语同义词辨析大词典(容新芳)》PDF

故另开新帖讨论。

隔壁P站发过,是已被封号的lbhl发的,对应的资源已经失效:英语辨析大词典 —— 英汉双解大型同义词辨析词典傲视群雄 - 其他词典资源区 - Other Dictionaries - 掌上百科 - PDAWIKI - Powered by Discuz!

这里给两个版本PDF:

1、本人发的1.4GB版本:
试读:http://book.ucdrs.superlib.net/views/specific/2929/bookDetail.jsp?dxNumber=000003105595&d=7BF38C357DC11B2DA14C9814886F1C8C&fenlei=08040110

链接:https://pan.baidu.com/s/1AKa3AbgNJDmIwp9767yfUQ
提取码:5o4m

另见我在原帖的回复:

2、400MB版本,感谢@freecomic101 提供:
链接:https://pan.baidu.com/s/1_zhvLUoAok8iJld3adzhjw
提取码:ymsl

============================

汇总资源之后,接下来来讨论图像质量问题。

以正文第43页为例,图像对比结果还是很明显的,从分辨率上来看就知道有差别:

首先是我转发的读秀存货版本,下称1.4G:

图片文件大小为1.14MB,分辨率2368x3296

然后是400MB的版本:

图片大小为326KB,分辨率1894x2636

400MB的版本感觉就是拿CEP简单做了点加黑和去背,没觉得视觉上比1.4GB好多少。

其实当然有比400MB更小的,比如简单粗暴二值化一下,用的是老马的CEP:cnblogs.com/stronghorse

对应配置:
纠斜: 自动_横排, 边缘扩展
色彩设置: 色彩数=纯黑白, 纯黑白(二值化)选项: 阀值算法=Wolf, 窗口尺寸=10, 去除与边缘接触的黑色区域, 边缘去毛刺

文件大小只剩113KB. 不过为了上传方便, 这里的图片输出是PNG版本的,大小为186KB,压缩比不如TIFF。压缩比和压缩算法的问题老马博客和CEP使用手册有谈,这里不细讲。

2 Likes

感謝 adwong 兄分享, IBHI 兄的那個缺了正文 154頁…正在頭大中,剛好你這個補齊,這本不太好索引…不知道是否能完工

2 Likes

把这两个PDF的正文 154頁或下一页,用这个各导出一张取样图片
PDF补丁丁 - 博客园 (cnblogs.com)
发个附件上来就好比较了

我不是又要偏楼,就是好奇——ibhl为啥被禁言了呢?

1 Like

似乎是倒卖资源?

可以去小黑屋看下。

lbhl
禁止访问
永不过期
2020-4-9 17:32
贡献了不少超星PDF,但不知为何盗传资源倒卖,不懂得珍惜大家的分享氛围。螳螂捕蝉,黄雀在后,想要再次打包、盗传其资源者不满,找来论坛投诉举报……

1 Like

有时候可以考虑4或8灰色。
第三张图把词头背景色搞没了,其实损失了信息

这边只是举个例子,具体要怎么处理算是最好,当然是另一回事。

所以原文有“简单粗暴”字样

2 Likes

然后154页,400MB版本没有,1.4GB有:

缺页的问题我也很头疼。就不说词典了,我这里的读秀存货,有些书缺第一页或者最后一页(往往意味着缺参考文献),有连在线试读页都缺页的(比如目录页,意味着无法补页),有中间缺页的,有页面不完整的,还有清晰度过于差的,真的头痛。

adwong 兄,清析度差搞好看了也很難受…還不如搞別的,清析度若是 ok 缺頁是還好一些,但因這不是詞典,也沒索引頁碼,相對來說比較難搞,可能只能手工