單詞音節詞頭的 OCR 取出與處理方法

是喔!哈!哈哈哈哈哈!那軟件我不會劃線…搞了很久,參數不太會設定,一直擺著…
參數設置實在複雜…很挫折…

我现在傻瓜操作。
我一开始也是哪都兼顾不好频频报错。后来索性就用好的图,然后用FastStone Capture测量直接读数填数,再也没出过啥烦人的报错啥的。

不會吧!…這樣搞法不累死了…這樣搞法不是辦法

就七个空,大师何出此言啊?

這個我知道,但我一直沒法把這些參數設定好,自動劃線時常劃不出來,怎麼試都不順,找不到原因…只好土法煉鋼,我覺得圖要很精確且參數也要設定到很精確才能達到想要的結果…難度實在很高,已超乎預期的想像…我真不知你們如何去調那些參數調到可以無誤,無法想像

对,自动画线突出词头的就不说了,想不成功都难。
其余的我手上有的图我认为图还可以的都试过了。
处理下图就可以了,有的缩进去的词头那种我也处理了,除非竖排有和词头一列或突出词头的序号(大黑点的那种),其余的都不会画错线,这样就可以拿到词头后ocr。
全弄下来几乎就设置下参数人工参与,其余的都是自动跑完。

这个软件不怕图差,怕图歪,有拉扯。
尤其是二次有人加工过不规整的图就不要碰了。

这个软件没那个难弄,你就读数填数好了。
校对完词头整页还是切词都可以用。

是喔!厲害了!唉!…我再找時間試試,希望能順一點…

請問圖是要處理成哪一種,我一直沒搞清楚, 4 grey也可以嗎?,還是 mono , 另外凹的詞頭怎麼搞

下了不少你做的词典,你弄的那些都能用,没那么多事。
就是文字内容用ComicEnhancerPro规范好位置就行了。

凹的詞頭我ps批处理图弄,当然是你熟悉哪个软件就用啥方法了。

ComicEnhancerPro 轉圖檔格式哪種劃線會好一點
4 grey 還是 mono

都行啊,我折中图大小和图的质量好坏,啥样的对划线没影响。
它把文字规范的位置才对划线有影响。
轉圖檔格式是你最后想用啥样的图片就弄啥样的。


沒差嗎?怎麼感覺是有影嚮的

你这都黑白的图了,就有2值和黑白的选,选其余的只能是增加文件的体量,啥用没有。
用个看图软件读读属性看再做决定。


那需要處理成背景透明嗎

别处理成透明的,因为我没处理过画线透明的图,也不知道行不行(懂得弄过的来回答)。
白底没有像素占不了多少文件体量。

1 Like

W2K 兄,謝謝您指點迷津,我再來多加試試,希望能順手…

应该不影响。

我猜這個大概是仁兄留的…哈!哈哈哈哈哈!
我是直到弄新時代英漢才知道大字會亂碼

我理解的楼主…
…无法正确显示的问题…可以很好的显示出来。

我手机用的多,要弄单双栏切换显示背透有重影,所以整页就没弄过背透的,整页用不单双栏背透应该可以吧。

你说的对,仁兄的隔空取物的功夫实在了得 :rofl:

既然你对新時代英漢着么热衷,要我说你都不用OCR出大字头出来,后面有词组的你就弄上来主词就好了,没有词组的用本站的golden的词典划词直接取出来,本论坛的现代汉语词典文字版简繁也都有了(正则下就繁简通搜了)。
弄起来很快的,和你没有简体输入关系是有,但不大。


以上我用电脑器跑完没做过任何修改截屏。

全部都是机器撸完就这样的东西还争论谁做的,词典归谁谁我不理解的(Can anyone tell me why?)。

2 Likes

哇!好厲害了,不很清楚你說的,我只會土法煉鋼…
難到不用校對嗎?
另外因亂碼哪知哪個是座標…我目前的處理法很難知道