Internet Archive网站得到的PDF体积很小,解析出来是jp2格式的文件,但另存为jpg或tiff格式进行处理必然造成体积暴增,就算是处理成二值化文件,也是比原始文件大。但原始文件往往发灰偏暗,而且不够清晰,延迟高,可读性较差。处理过20卷的OED2,感觉特别明显,有2卷就是黑乎乎的,直接看眼睛都要看瞎了。而且有可能有个别页面由于原始扫描的问题,整页是模糊的(比如OED2第7卷正文第471页)
Internet Archive网站得到的PDF体积很小,解析出来是jp2格式的文件,但另存为jpg或tiff格式进行处理必然造成体积暴增,就算是处理成二值化文件,也是比原始文件大。但原始文件往往发灰偏暗,而且不够清晰,延迟高,可读性较差。处理过20卷的OED2,感觉特别明显,有2卷就是黑乎乎的,直接看眼睛都要看瞎了。而且有可能有个别页面由于原始扫描的问题,整页是模糊的(比如OED2第7卷正文第471页)