J̥H́-交流 - 词典软件词库制作技术探索之 CC-CEDICT - JH 20200509 - 给未来的词典软件的礼物


20200601, 此贴技术探索的前序贴在 J̥H́-交流 - 词典软件词库制作技术探索之词条里只有一个script标签的mdx词典 (备注在此,便于爱研究的朋友寻根溯源)


20200511, 更新了 浏览器版本 https://dictionaries.johannhuang.com/cedict/

更新部分:

header, footer, candidate keywords, and clickable associate definition

效果如下图


20200510, 15:00 Update, 前前后后经过多轮的试错,自己终于编译好了自己的第一个版本的GoldenDict,将其使用的WebKit也赶上了Safari 10的版本。最后,也终于让我的词典在GoldenDict里面跑起来了。所以嘛,不得不说GoldenDict就是词典软件里面最先进的代表。


20200510, 01:55 Update Web Version, https://dictionaries.johannhuang.com/cedict/

因为词典软件浏览器内核普遍老旧,因此本词典仅支持flask-mdict,详情预览见下面的GIF。
CC-CEDICT

词典文件 已移除,建议使用 浏览器版本 https://dictionaries.johannhuang.com/cedict/


Added by hua

https://8o.cx/mdict/ 即可体验。

2 Likes

flask-mdict 搞不定…

这词典有什么新的特性?

这词典,过去不曾存在。因为可以更具不同动作加载不同数据。很好玩!

我知道了,用 JS 实现了一个类全文搜索。
不过有瑕疵。today 会匹配上 day 。
很不错的尝试,技术很不错。

就是大概只适合小本词典略显遗憾。

其实大本也可以,可以通过网络请求,不过又回归到在线词典。

我目前对这个词典还是很满意的。哈哈哈~

就是目前的词典软件太弱小了。

可以把玩我的在线版词典 http://cedict.dictionary.johannhuang.com/

1 Like

flask-mdict

  1. 現有的 mdx 格式都不支援嗎?
  2. 如你所說的,mdict 內核過於老舊,那支援 clip path 此標簽嗎?frame 呢?可否試一下,類似此功能
    3 . 目前有全文搜索嗎?是否也有支援

我覺得這應該是下一代辭典應該要具備的,除了全文搜索外加自己抓下的網頁置于某一個目錄,或純只有給一個網頁的網址應該是也要一并搜索,可以參考一下 personal brain 軟件

如果没有网络,你的世界将会怎样?你无法预知下一秒会不会断掉,就如年前爆发的肺炎。所以,离线永远不会过时。

这个就是离线词典,你对在线和离线的认知还需要加强

这个和mdx格式无关 和词典软件的浏览器内核版本有关;你说的clip path我不清楚,不怎么用得到,frame标签以及淘汰,不再推荐使用;全文搜索暂不支持,不过支持起来也不难

johannhuang 兄:
謝謝您的解釋和指點迷津
覺得你弄得 CC-CEDICT 比目前的其他版本都好查
考慮弄個 mdx 版吧 flask-mdict 雖好但搞不定
:smile:

多谢认可!第一版的就是mdx哦,不过很可惜目前的词典软件浏览器对我使用的JavaScript代码支持并不好,这点上我也无能为力。虽然我自己确实有考虑做词典软件,不过距离完工,我自己估计可能也得至少一年吧。(因为得从C++开始学起)

1 Like

哎!可惜了看得我也心動,想花點錢請人幫忙弄個自用的網域,當然需所有內容全文搜索的

可能性是有的,那就得靠鲁兄自己花心思去弄了。投入时间,努力学习,总能搞定。 - 今日心得

我无知了,解压后在GoldenDict中无法用,查词空白才这么说的。

不是什么无知哈~ 现在 这种查词软件的内核都挺低的,不怪你。

johannhuang 兄:
如此稱號 “鲁兄” 小弟愧不敢當…近來常尿血不止…身體已不如以往…江河日下…請饒了小弟…
小弟最近換跑道改走清純帥哥路線…請多海涵, 加持一下 :smiley:

HI 楼主,https://8o.cx/ 很漂亮,可分享下思路和代码吗? 谢谢。