J̥H́-交流 - 词典软件词库制作之对词典软件安全漏洞的合理利用

首先声明这是一个非常危险:warning:的行为,不过却也挺可爱的(因为确实能解决问题)。

今天看到FreeMdict推送里面有下面这个:

lexico.com 联网版 - MDict 词库资源区 - MDict Dictionaries - 掌上百科 - PDAWIKI - Powered by Discuz!
我比较需要牛津的例句,为了方便查找所以制作了这一个词典。这个并非离线版,所以不包含任何词典内容,唯一的作用就是即时下载并排版从 lexico.com 的美语词典查询到的内 …

看来pdawiki也不光只有技术憨憨,还是有有技术可造的人的。这个词典应该就是利用了词典软件的浏览器没有进行跨域限制,所以直接实时利用AJAX抓取网页内容然后添加到词典词条。(不知道是不是被我的给未来词典软件的礼物启发了,发现词典软件可以好好玩耍呢?)

个人还是比较支持这类跨域使用的,毕竟大部分时候词典软件里面我们并不会登陆账号什么的,所以相对安全吧。(不过如果JS逃出词典软件的限制,开始在操作系统文件里面搞事情那可能就是大事情了。)

这类词典相对于 爬虫抓取的在线版离线化的词典有两个好处:

  1. 数据永远是最新版 (不过词典网站改版的时候可能需要升级JS代码)
  2. 法律方面可能是个擦边球而不违法(因为JS代码只是代替用户单次请求而已,这和爬虫离线数据是有本质区别的)

在这里发个帖,继续做个词典技术运用启明代表。


不知道有哪些词典软件对跨域的AJAX是允许的,还希望知道的小伙伴回帖交流。

那就把需要的词条列表当做有呗,没有的话显示default信息就好。

可参看
科林斯的两部独具特色的 Internet-Linked 辞典
https://www.pdawiki.com/forum/thread-38730-1-1.html

你给的链接里面除了一个证实不了的猜想没啥信息量哈,内容里面两个链接还有一个失效了。另一个我也贴过来吧,免得后续看到的朋友还跳转一步才能看 https://www.harpercollins.com/9780007556700/economics-collins-internet-linked-dictionary-of/ 。虽然标题里面写的是 Collins Internet-Linked Dictionary of,然后不购买也看不到具体实现方式,可能Internet-Linked也就是指的API调用而已也不准。