【交流】图片词典制作

仁兄整理的pdf筆記相當清楚,原本不解的一些東西,頓時撥雲見日,厲害了!

chigre前辈写的挺全的,就是比较分散。我只是进行了分类汇总,补了一个扣图命令行。

新时代英汉大制作过程中有了新的经验和教训,周末更新~

蠻分散且很多圖也無法顯示…更多的是有看沒有懂…哈!哈哈哈!

看到你筆記有收錄一個 Tip :
[2020.07.31更新]遠東英漢大辭典 全索引 詞頭 - 第4页 - 资源自助服务区 - Resource Exchange - 掌上百科 - PDAWIKI - Powered by Discuz!

用每頁單字的順序號去除以那一頁的單字總數
0%~100%
50% 為大概的另一欄
大部份右欄的第一個單字大概會在 40%~~60%左右

但不太正確…這有較為詳細的驗證解釋

可以參考

好嘞,我一会儿补充。

1 个赞

粗略定位的想法…跳脫座標方式…利用 30 個樣本來大概定位…

1 个赞

能付上一下相关软件就好了,我看了你的文档,想确认一下上面提到的软件 现在都能在隔壁公开找到吗?比如你有使用的chigre版的picture capture?

在本坛tg群里

1 个赞

是那个7月26号。有一个81mb的压缩包吧?

好像有解压密码。

sry,我看错了,有解压好的。。

我拿到手就没有解压码,猜测应该是文件名第一个_前的内容。

嗯,等下吃完饭研究下。不过我觉得,如果出个教学视频,拿词典中的其中一页来做个demo操作示范,这种会不会比较受众,易懂呢? 教学类的视频感觉还是一片空白。。 对于很多想做词典的人来说,有一点万事开头难的感觉,尤其没太多编程基础的, 也许一个好的教学能点燃不少人交流,制作,分享的热情,也或许只是我想当然了。

抱歉,我不想录视频,网课看到吐。

根据参数图(PDF封面或者软件压缩包内参数说明)设置好参数再点智能画线测试几页。准备好page_words.txt和wordslist.txt后点击校对,报错则继续调整参数(间隔和宽距)。
智能画线

智能画线无大问题,点击校对也没有报错,可以开始自动画线:
自动画线

自动画线完成,可以OCR,也可以直接进入校对模式填充词条(如图设置,该页画线数与索引数相等则自动填词)
填充词条

画线与校对词头完成后画出插图区域,按照格式填写必要信息。
扣插图

以上过程中只要对画线进行过调整,就需要点击图片名刷新图片,切记!切记!切记!

@HDtiger 在这里回复你提的问题。
Q1:如何设置参数才能实现全自动画线?
A1:依照参数图,移动鼠标,根据软件左上角显示的坐标计算出个各个值。

Q2:抠图命令要用到XY坐标和图片宽高,但抠图时产生的数据多余。
A2:我想你应该是混淆了切图与抠图。切图是利用画线完成后得到的X、Y、W、H四个值将整页图片切割成长条。抠图是用多个坐标点画出插图区域,再利用坐标点将插图抠出来。ppp里记录的是插图附近的点坐标,而非固定的四个值,不存在数据多余。

PDF预览:



目前还真没遇到过PDF不能解决的问题。 :rofl:

2 个赞

为什么我设置好后校对也无报错,点击智能画线只能智能的画几条,很多词条没有画成线

1 个赞

参数没调好或图片不规整。
调整手动X,微调判据,向右比例,观察效果。
智能画线不一定就准确,多测试几页,没大问题自己后期手动调。

1 个赞

解决了,不是图片问题,是微调判距的问题。
另,抠图命令给个例子,我看命令格式是怎做的。

扣图命令可参考那个链接复制一下,浏览器打开……

1 个赞

你最后用的excel模板是哪一个,是单独的切图模板还通用的模板?