一千多楼你都翻一翻,有人发过原数据库的。
1.可以抓取,作者说了,也给了建议。
爬下来用,跟在线用,恐怕不会一样。Okayer的在线版是用专业软件做的啊,得编译很久。
爬下来做成mdx,就得受限于mdx的一切局限。
2.TIO (thirty in one?)没有离线词典。
其前身SIO(six in one?)才有。
离线的反查合集,可以用这个:
单看数量多于TIO。
很多人大概对这个TIO眼馋(不包括我在内,我几乎不收英文词典)。
Okayer说:“如果有朋友想制作离线词典,欢迎抓取、分享。”
楼主假如要爬了做mdx,欢迎分享。
不可能和在线版一样,但是假如传出来后,有人再改,慢慢就会完善的。本坛的词典多半是这样的。
单纯的网络下载层面,爬点儿啥,不算事儿,如果扯上网络安全层面的安全加密屏蔽啥的,基本上跟黑客一样,没啥服务器限制的话,基本上也没啥难度,就是蒙个词头,keyword列表啥的,自己设置的爬虫索引未必会跟人家的一一对应上,或者服务器这块开放的比较彻底的话,对外能提供个关键字索引的话,能方便点儿。我自己当年曾经黑过人家大学的学生档案,好在自己还算有原则没干啥出格的事儿,人家知道了,也没为难我。
曾经在论坛上下载过sio,使用了几天也删掉了。线下词典应该追求准确、精致,不必追求巨无霸型太大的词典,除非有特殊目的(比如做某种学术研究),查词典仅仅为了解决问题,能直截了当解决问题的词典才是好词典;如果查出的东西太多,根本看不过来,等于没查一样。类似tio这样的词典,本来就适合线上使用,万一有需要能查一下即可,制作成线下词典有意义吗?
最近看到这部词典 极简英汉词典 ode+encarta,感觉就很好,在阅读英文材料时需要查一下,很便捷,且真能解决问题,再次推荐。
tio适合当资料查,要是正儿八经用作开发的话,sio更适合,sio都是词典例句,且有mdx。tio里收录了一些不太准确的语料库,比如影视字幕。
其实哪怕是sio,里面收录的美国传统的中译就质量堪忧,真要对照学习的话问题多多。