件乔国记霜姐英-汉词典扫描图片参数设置

https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=12894&highlight=剑桥国际
件乔国记霜姐英-汉词典,外叫社2004年修订版,1650页,A4开本,拆书扫描,如何设置方便做切图词典的扫描参数?谢谢大神!
已经扫好的页面,太大了啊啊:scream:目前是全色,600dpi真的太大了

48af9d97d49932e492c1876fa3c1f26d1501ead87c50907c79a0c53fc5c3f01d|666x500






2 个赞

如果时间允许,600DPI 当然是最好的。文件大不要紧,开头就弄最好的扫描件,之后优化也有空间。

至于扫描仪的参数我也不懂,等楼下解答。

吹牛兄,剛看了你掃的文檔,因單詞都有音節點,若是用chigre 切圖軟件內OCR 效果是不好的,一般是先找到區間內的單詞,此步驟如同粗配,把單詞粗配到每頁,然後畫好線後,再一個個點擊,若有缺詞再於那個詞條補上,這樣才能把文本的單詞和位置對應上

如此那就是把圖掃好,盡量清晰不變形

2021-01-03_152523

背景别去的太狠(图啥样就扫出来要样,后期可以调整的)。
锐利往回调调,太锐了。

既然都600了就没必要背景消除太高。
锐度再降些会好些。

尽量眼睛看到的都扫出来,剩下的交给后期软件处理。

@ 炊爱牛 辛苦啦。

赞赞赞!!!

感谢!
背景 我就不调了?或者设置为 标准?

锐利 调到哪个地步比较理想?-1,-2,还是-3?

另外,必须是全色才行吗?原书只有少量黑白图片。。。

现在你的图字的边太锐了,还是全色的吧,后期宽容度高,可调性大。反正设置好了也是机器干活,要原始的数据全,以后就省事了。

1 个赞

全色好的。如果您时间方便,麻烦您再明确回答一下7楼的问题,我就开工了

参数你试试,你调下看效果和纸质越接近越好。主要调整完参数还是要看图(实际的纸质和扫出来的电子文档比较,扫出来的图越接近眼睛看到的纸质样子越好)。tif几乎携带了所有的图片信息,完事了根据自己的需要再做调整。

好吧,之所以反复麻烦您,是因为身边没有自动扫描设备,我委托非专业的他人给我扫。。。

没麻烦, :joy:
现在你传上来的图已经很好了,开扫吧。
切图足够用了
谢!给扫图让词典更丰富。

1 个赞

对于这种词典,不需要全色,建议灰度600dpi扫描即可。
其它的话就像楼上说的,尽量按原图来就行,背景消除标准,锐化调到0。
附上处理后的png样张,已经背景透明了,若处理成不透明的tif话可以更小。

1 个赞

切词高亮定位要背景的,不然两张图有叠影。

这样啊,受教了,那样的话体积更小了 :grin:
我是想着要是做成Vim大那样的就挺好了啦,切词工作量太大 :grin:

可以试试 600 dpi 黑白渲染(dither),
再用 scantailor despeckle 去掉杂点。
不过渲染的效果要看扫瞄机的演算法,
我用 Fuji Xeror 的还不错。

1 个赞

谢谢!!新年快乐(✪▽✪)