关于巨型图片词典瘦身

隔壁的年度重磅来了,但问题是。。有这么大的硬盘吗?

【圣诞礼物】Waverley Pictorial Dictionary/Waverley Children’s Dictionary - MDict 词库资源区 - MDict Dictionaries - 掌上百科 - PDAWIKI - Powered by Discuz!

实在有必要考虑一下,巨型图片词典的优化问题。比如之前的高清版英汉辞海。

目前较好的方案是png+背景透明,在GoldenDict里边的阅读效果甚好。 印象中Vim的图片词典大多数是这样。

如果使用率不高的话,tif格式体积更小一些。但无奈必须用nonwill版GoldenDict。

解包mdd→ComicEnhancerPro处理图像→打包mdd

以帖子中放出来的截图为例

直接16级灰度效果:

去背景阴影,但数值稍高就会损失图片中模糊的部分:

目前方案:

纠斜: 自动_横排, 边缘保留
切边: 上=0.6%, 右=0.8%
DPI=800
页面大小: 内容框大小
去除背景阴影: 1缩放: 200%
多尺度细节增强: 40
高斯锐化半径: 1, 阶数: 7
USM锐化: 遍数=2, 数量=80, 半径=1.0, 阀值=0
色彩设置: 色彩数=16级灰度, 调色板量化算法=八叉树, 16级灰度以下PNG设置背景透明

2 个赞

大佬可否共享一下您瘦身后的mdd?

多找几个人,每个人负责一个mdd处理,其实很快
你有兴趣的话可以组织一下
我还在试验怎么得到最佳优化效果

depending on how the image was scanned, you may lose considerable information converting to monochrome.

the safe setting for transparent backgrounds is 16 grayscale. usually you can scale down to 4 gray for text scans, or 8 gray for illustrations, with only negligible loss. it is not worth going to monochrome if you notice any image degradation. in those situations, it’s possible to force monochrome after fiddling with the color curve or gamma but it’s usually not worth it since you won’t shave off much file size compared to 4 gray.

finally, I recommend using PNG Gauntlet which uses PNGout for lossless compression. it can easily cut away 10 percent of the file size for PNGs outputted by Comic Enhancer, and up to 60 percent for Photoshopped PNGs!

1 个赞

目前CEP只能对整张图片作同样的处理,无法像PS可以处理局部。因此,我的经验是:
纯文字:用CEP,简单高效;
图文混排:先用CEP切边、纠斜等;后用PS透明化(CEP只能16级灰度以下才能透明,而PS可以彩色透明、局部优化等高级操作);再用pngquant瘦身。

有部分图片用CEP处理后goldendict无法打开(不清楚具体哪种情形会遇到此类问题),甚至崩溃(给老马反馈过,他说其他图片软件都能正常读取,或许是GD的问题),此时只能用PS进行透明化。

PS: 根据资料显示,tinypng、pngquant、ImageAlpha、pngnq都是有损压缩,基本采用的都是quantization算法,将24位的PNG图片转换为8位的PNG图片,减少图片的颜色数;pngcrush、optipng、pngout、adV**g都是无损压缩,采用的都是基于LZ/Huffman的DEFLATE算法,减少图片IDAT chunk区域的数据。一般有损压缩的压缩率会大大高于无损压缩。

2 个赞

给楼主一个建议,不要折腾图片了,直接上个大硬盘就好。
我以前以为很贵,结果双十一时买了个4T蓝盘才500多。

不知 CEP 还是其它工具有没有 dither 抖色功能?
解析度够的话,效果还可以,
会比直接黑白二阶化好,又可缩小档案。

隔壁的这本词典你们在goldendict上能正常显示吗?我这儿无法显示。

用这里的版本试下,GoldenDict(Linux/macOS/Windows)基于Qt5.15.2/Qt6.X版本

我这儿也可以了,之前是因为文件被破坏了。

2 个赞

嗯,试了下原版也是可以的。