首先声明这是一个非常危险的行为,不过却也挺可爱的(因为确实能解决问题)。
今天看到FreeMdict推送里面有下面这个:
lexico.com 联网版 - MDict 词库资源区 - MDict Dictionaries - 掌上百科 - PDAWIKI - Powered by Discuz!
我比较需要牛津的例句,为了方便查找所以制作了这一个词典。这个并非离线版,所以不包含任何词典内容,唯一的作用就是即时下载并排版从 lexico.com 的美语词典查询到的内 …
看来pdawiki也不光只有技术憨憨,还是有有技术可造的人的。这个词典应该就是利用了词典软件的浏览器没有进行跨域限制,所以直接实时利用AJAX抓取网页内容然后添加到词典词条。(不知道是不是被我的给未来词典软件的礼物启发了,发现词典软件可以好好玩耍呢?)
个人还是比较支持这类跨域使用的,毕竟大部分时候词典软件里面我们并不会登陆账号什么的,所以相对安全吧。(不过如果JS逃出词典软件的限制,开始在操作系统文件里面搞事情那可能就是大事情了。)
这类词典相对于 爬虫抓取的在线版离线化的词典有两个好处:
- 数据永远是最新版 (不过词典网站改版的时候可能需要升级JS代码)
- 法律方面可能是个擦边球而不违法(因为JS代码只是代替用户单次请求而已,这和爬虫离线数据是有本质区别的)
在这里发个帖,继续做个词典技术运用启明代表。
不知道有哪些词典软件对跨域的AJAX是允许的,还希望知道的小伙伴回帖交流。