h105是拿朗文6英文版的词头去抓金山的双解6数据,确定来源是金山,抓不到他就用英英版数据补充。abs的数据是2.19之后,某个群的人找人专门抓的,为什么例句里标的ldoce5,原因不记得了,但应该没抓错。这个群是某个大群被封之后拉的小群,专门众筹词典的,为了各种词典,又会再拉小群,论坛早期的收费词典,大多是这个群的人发的。
我只尝试过2.19,后续的3.0,3.2都没有用过,搞不清楚他们什么关系。
h105是拿朗文6英文版的词头去抓金山的双解6数据,确定来源是金山,抓不到他就用英英版数据补充。abs的数据是2.19之后,某个群的人找人专门抓的,为什么例句里标的ldoce5,原因不记得了,但应该没抓错。这个群是某个大群被封之后拉的小群,专门众筹词典的,为了各种词典,又会再拉小群,论坛早期的收费词典,大多是这个群的人发的。
我只尝试过2.19,后续的3.0,3.2都没有用过,搞不清楚他们什么关系。
翻了翻牛津英汉辞书app,第十版还删了一些词,瞟了一眼,比如A2,abaci,ABD,第十版拿到了还是要和第九版互补,数据不然不完整。第九版数据包反而比第十版大20mb。曲折变形库有的第十版比第九版全,比如Abominable Snowman,只有第十版可以搜Abominable Snowmen。
第十版还有图片降级体验。。。上图第九版,下图第十版。 不过第十版的图片更新了,内容更多,但是没有做放大处理,好草率。
现在论坛里拿官网英文版匹配中文已经是很理想的选择了。
论坛里其他词典反馈的各种匹配问题还是不怎么放心,有些作者可能技术很好,没有这些问题。
PS:看你截图里stir-fry的词条,外研社的APP真是省,没有配图,没有词语搭配,也没有主题分类。。
商务的app是以纸质版为基础,追求与纸质版完全一致(汉化后的彩图不插入也是为了这一点吧,虽然技术上可以做到,但是电子化人员谁在意这个?),各种专栏可能是编辑有意删除的(空间有限),而牛津英汉辞书不是,本身就是电子版不怕内容多。
还记得坑爹第九版app海笛都只给英文图片(懒得电子化直接从牛津官网搬?),所有词条只能在线看。商务印书馆厚道多了,数据库完全不加密裸奔,离线随便造,还给在线网页查询。
说到图片,我记得好像某些非牛津版权图片(这些图片还要在末尾写一大串致谢出处)还是纸质版专属(也就是非彩图,不来自附录,直接附于词条旁),app和官网都没有来着?毕竟要在电子版上得再交一遍版权费?不知道有没有记错,很久没翻过纸质版了。
英英原版app官方免费开放下载了,谷歌和苹果商店都可以下到,你看看缺失部分能不能从app获取
我今早在官网发现一个牛津高级美语词典带图片的单词列表 Browse pictures from abdomen to bay in Oxford Advanced American Dictionary at Oxford Learner’s Dictionaries (oxfordlearnersdictionaries.com) 。其他参考 Word Lists in Oxford Learner’s Dictionaries | OxfordLearnersDictionaries.com
牛津高阶英汉双解词典(第10版)官网都有app了,论坛里的2024新年福利:牛津高阶双解第10版和韦氏高阶双解完美版分享(02.23更新fire)这个不是经过人工校对的吗?
人工校对的数据不等于原版数据,原版数据现在只有港版APP里有,目前还没有流出的。外研社APP里的数据不是纯HTML的,所以论坛上作者只能提取中文翻译,插入到英文版里。
你给的链接里的词典,就是英英版的英文文本混合了双解的中文翻译,属于嫁接版。我只用过Robot版的双解10,毁灭了我对嫁接版的信心,而且双解9已经满足我期待了,所以论坛其他作者的版本我没用过,可以接受嫁接版的话,建议尝试下,别被我污染了。
哦,原来如此,谢谢告知。
港版APP需要付费吗?繁体/粤语都看得懂。把数据弄成.xdm方便聚合使用。
也就是说我下载的版本不是原始原本无损数据?
那方便说一下论坛里面哪些是属于原始原版数据制作的吗?新人刚接触聚合辞典不久,对此行业不太了解。
接受不了嫁接版,主要担心数据有疏漏或者不准确亦或者数据被篡改或删减。
嫁接版很少的,嫁接难度很高,尤其是数据对不齐的时候,还需要手工补齐,缺失的翻译还要用AI翻译补全。作者发贴的时候也会对词典有说明,比如前面链接里,作者就说翻译有另外来源,这种就是嫁接版,楼层盖很高,反馈很多的词典,其实不用太担心质量问题。港版APP是指牛津英汉辞书 (链接),这个是付费应用,第10版数据提取脚本 (链接)。
牛津9我用的3.1.3版,数据来源是上面APP第9版时提取的数据,这里有下载(链接),其他的比如柯林斯v2.30,LDOCE5++ v2.15,都是论坛好评很多的版本。
新人可以在论坛搜索关键字,或者直接用站长早期整理的 (链接)。
非常感谢告知具体出处。链接里面的其他辞典都是质量严谨性有保障的?
那么,如何判断是否是从官方app提取的原始数据呢?判断的依据是?
作者发贴的时候都会提数据来源,不方便提的,也会暗示你。论坛找不到出处,可以发贴问。词典数据主要就三个来源,光盘提取、APP数据、官网爬取,这三个来源都很靠谱,只是提取的词头可能有差异,这个就看作者技术了,数据本身是没问题的。
其他词典我没用过,只要避开嫁接版就不太需要考虑质量问题,嫁接版用户多的,其实也没什么问题。
能帮忙把这个百度网盘里面的整个文件夹转存Google Drive或Mega吗?百度网盘没登录账号和付费下载速度简直惨不忍睹。多谢
国内上传国外慢得要死,慢慢下吧。
hua大的意思是,即使是从品牌辞典官网APP提取数据也不是所有数据都能完美识别提取。而从你前面表达的意思来看,你是觉得能完美无损的提取官方APP的数据。
不要两边发。
好的,我只是想弄个清楚这到底是怎么回事