h105是拿朗文6英文版的词头去抓金山的双解6数据,确定来源是金山,抓不到他就用英英版数据补充。abs的数据是2.19之后,某个群的人找人专门抓的,为什么例句里标的ldoce5,原因不记得了,但应该没抓错。这个群是某个大群被封之后拉的小群,专门众筹词典的,为了各种词典,又会再拉小群,论坛早期的收费词典,大多是这个群的人发的。
我只尝试过2.19,后续的3.0,3.2都没有用过,搞不清楚他们什么关系。
h105是拿朗文6英文版的词头去抓金山的双解6数据,确定来源是金山,抓不到他就用英英版数据补充。abs的数据是2.19之后,某个群的人找人专门抓的,为什么例句里标的ldoce5,原因不记得了,但应该没抓错。这个群是某个大群被封之后拉的小群,专门众筹词典的,为了各种词典,又会再拉小群,论坛早期的收费词典,大多是这个群的人发的。
我只尝试过2.19,后续的3.0,3.2都没有用过,搞不清楚他们什么关系。
论坛里其他词典反馈的各种匹配问题还是不怎么放心,有些作者可能技术很好,没有这些问题。
PS:看你截图里stir-fry的词条,外研社的APP真是省,没有配图,没有词语搭配,也没有主题分类。。
商务的app是以纸质版为基础,追求与纸质版完全一致(汉化后的彩图不插入也是为了这一点吧,虽然技术上可以做到,但是电子化人员谁在意这个?),各种专栏可能是编辑有意删除的(空间有限),而牛津英汉辞书不是,本身就是电子版不怕内容多。
还记得坑爹第九版app海笛都只给英文图片(懒得电子化直接从牛津官网搬?),所有词条只能在线看。商务印书馆厚道多了,数据库完全不加密裸奔,离线随便造,还给在线网页查询。
说到图片,我记得好像某些非牛津版权图片(这些图片还要在末尾写一大串致谢出处)还是纸质版专属(也就是非彩图,不来自附录,直接附于词条旁),app和官网都没有来着?毕竟要在电子版上得再交一遍版权费?不知道有没有记错,很久没翻过纸质版了。
英英原版app官方免费开放下载了,谷歌和苹果商店都可以下到,你看看缺失部分能不能从app获取
牛津高阶英汉双解词典(第10版)官网都有app了,论坛里的2024新年福利:牛津高阶双解第10版和韦氏高阶双解完美版分享(02.23更新fire)这个不是经过人工校对的吗?
人工校对的数据不等于原版数据,原版数据现在只有港版APP里有,目前还没有流出的。外研社APP里的数据不是纯HTML的,所以论坛上作者只能提取中文翻译,插入到英文版里。
你给的链接里的词典,就是英英版的英文文本混合了双解的中文翻译,属于嫁接版。我只用过Robot版的双解10,毁灭了我对嫁接版的信心,而且双解9已经满足我期待了,所以论坛其他作者的版本我没用过,可以接受嫁接版的话,建议尝试下,别被我污染了。
哦,原来如此,谢谢告知。
港版APP需要付费吗?繁体/粤语都看得懂。把数据弄成.xdm方便聚合使用。
也就是说我下载的版本不是原始原本无损数据?
那方便说一下论坛里面哪些是属于原始原版数据制作的吗?新人刚接触聚合辞典不久,对此行业不太了解。
接受不了嫁接版,主要担心数据有疏漏或者不准确亦或者数据被篡改或删减。
非常感谢告知具体出处。链接里面的其他辞典都是质量严谨性有保障的?
那么,如何判断是否是从官方app提取的原始数据呢?判断的依据是?
作者发贴的时候都会提数据来源,不方便提的,也会暗示你。论坛找不到出处,可以发贴问。词典数据主要就三个来源,光盘提取、APP数据、官网爬取,这三个来源都很靠谱,只是提取的词头可能有差异,这个就看作者技术了,数据本身是没问题的。
其他词典我没用过,只要避开嫁接版就不太需要考虑质量问题,嫁接版用户多的,其实也没什么问题。
能帮忙把这个百度网盘里面的整个文件夹转存Google Drive或Mega吗?百度网盘没登录账号和付费下载速度简直惨不忍睹。多谢
国内上传国外慢得要死,慢慢下吧。
hua大的意思是,即使是从品牌辞典官网APP提取数据也不是所有数据都能完美识别提取。而从你前面表达的意思来看,你是觉得能完美无损的提取官方APP的数据。
不要两边发。
好的,我只是想弄个清楚这到底是怎么回事