牛津短语动词词典 英汉双解版 第2版


牛津短语动词词典 英汉双解版 第2版 .txt (2.5 MB)
因本人,能力和精力不够没法再做下去了。希望有能力有时间的朋友继续做下去,惠及广大英语学习爱好者。这本是我通过ocr后,校队了差不多40天完成的。没有遗漏的。稍微多了的词头是这本词典里的小品词用法给加进去了,诸如at, about, with等等。个人觉得介绍的详细易懂,如没有了可惜就加进去了。

13 个赞

对了,忘说了。现有的pdf有两本,有一本是却两页,后来通过另一本补过来了。

3 个赞

仅提取了基本词条,没有对其他内容做处理。有精力的可继续优化:

oxford_phr.css (37 Bytes)
牛津短语动词词典 第2版.mdx (1.2 MB)
mdx.txt (2.7 MB)

11 个赞

很好的词典,谢谢 @sakula 的大量时间投入,以及 @random 的制作分享。

牛津辞书APP新增了这个词典,可惜之前的神秘高手没有破解新版的数据

如有时间可以合成一个完整清晰版本,上传到 cloud.freemdict.com,方便愿意继续校对的同好

6 个赞

FYI:

3 个赞

关键是缺页,不知道这本缺的是哪两页?

超星在扫描这几本牛津的时候问题不少。《牛津英语搭配词典 第2版》也有很多错页(即好几处页码顺序不正确),并且缺第264页(可能还有第263页?)。

1 个赞

楼主没有细讲,我制作PDF及这个帖子发出的时候也没有注意到、或者有人反映有缺页。

可以自行下载并查看是否有重复页面的现象。

(EDIT:
https://cloud.freemdict.com/index.php/s/bjW2HMgGsyf4FME

3 个赞

期盼已久的重磅词典终于问世了,感谢所有参与制作的同好。希望哪位大侠出手继续优化。

2 个赞

辛苦了,OCR时为什么没有合并分行?方便校对?实际上在OCR工具里合并段落可能是最省事的,虽然有错误,基本可以自动处理,导出来之后再合并很多情况要人工一行行判断。

1 个赞

只要页面完整,少数顺序不正确倒也不是什么大问题。

4 个赞

(尤指
事彗或自然灾害发生之后)了解


司挫畋最大的对手,赢得了合同。

绝对不会发生茂种事情。

将…表演出乘

他觉福这种规定饮食
很难坚持。

其实有务加人坚持这一观点呢?

承认我很喜欢她的薪扮相。

流浪者队的这名年轻球员对准球网施射

你认务他会接受他们的提
议吗?

公开支持;站在…-边:

岳计到衣服可能会缩

这些事实灵能有一种解释

小孩)还嘴.翠嘴:

通清用于否定句。

我可以担仪她为人诚实。

受害言家属畜求帮两抓捕凶手。

我儿
字已申请就读沃里克大学。

她在宿中问起我
了吗?

申请工作/护如/补助

与 (不被认同的人) 密切交往;和…
廊混:

把… 归因于;认岛…真由于:

通常为欢善状况 ) 使

背弃,不
再支持 (案行动或想法):

放过(某入); 不再烦扰(某人):

确证
(主系 理论或其他证据):

较礼貌和非正式的表送方式

啰唆:絮叨

杯咖啡喝,可是所有地方都打洋了。


备好 (做案事);预料到:

擅自闯入;冒味介入

tPBJl ideas, figures

痛骂;
厉声教:

落动、演出、表演等)

他总爰唠叨
他赚多少钱。

就旧的;破损的:

相信…存也 信奉;信仰:

相信某I做得出 (尤指坏

响尾蛇属于蛭蛇科。

blast /blɑːst; AmE blsest/

给 留下深
刻昂象;使十分惊愕:

makes it faU out (窗户)

(因计划、交易关败或形势
恶化而) 使某人栽跟头

(被) 炸死 炸A

中骗取;讴骗…交出

别把牛奶煮漕了。

(怒火、挣论等) 恶化,失

把…弄环;把…
搞糟:

[OBJ] pressure, the inevitable erm give in (to

得不请警豪来撞开门

洗衣机又环了。

我的手
表环了。

我脸上老
是长粉剌。

spots on the face, etc. 长粉剌:I’m prone to

(细姻或关系的)破裂,结束:

break with sth (formaP)

彰显,充芬表现出 (某一特

:diamonds: v + adv + n :diamonds: v 十 n/pron + adv

carry sth forward rsh

莱茜督察参与丧项调查。

陪审团作出
了看罪裁决。

明年春季,出板社要推出这部词典的新

大气中二氧花碳的增加

搭乘飞机的人多了,因机票超售被拒载的机率也————【几率】

bunch up/ togethen .bunch sb/sth

用过度或过热) 出故障, 损环:

毁的;烧环 burnt-out buses 烧成空壳的公共

:diamonds: v + adv + n :diamonds: v + n/pron 十 adv

► buyout n (finance} a situation when sb

(打开门禁) 让…进来: ————【…】

自动重拔功能

► un called for odj ( of remarks or behaviour

全面禁止核底器。

tel叩hone call to sb 打电话给某人

照顾,如料 (尤指
病人、伤员、幼童或老人):

他们之间的通
信续了四十多年。 ————【延续】

她努方摆脱童年所受教

一些游客亲入了那场暴乱。

沉浸在拍卖的兴奋和剌激中

:diamonds: v + n/pron + adv :diamonds: v + adv + n {less frequent)

靠近拐角时,减至二挡。————【档,原书误,当然,大多数人们读到的文献也是错的】

陵堡改成了旅馆。

我得换掉食
身湿衣服,免得着凉。

变换 (家具、入员等) 的位

gear (开车) 换高一挡,换挂高速挡:Change
up into fourth gear now. 现在加速到第四挡。

chase sb/sth down (AmEf informal)

我们正在寻找当时出届晚会的
另外两个人

他在每位来宾姓名旁都打了个钩 ————【勾,原书误】

交作业前,我得
仔细检查一下辫写。

为…加油,给…打She could hear him

(心境、精神或蓿绪) 快活起

最近的民意调查旬以让政

(机器) 使损
环,毁坏:

谈话:'AbsolutelyV she chimed in eagerly.

agree with sth; to be similar to sth 与-致;

chuck sb out; tchuck sb out of sth

claw /kio:/

2 if a government daws back money it

clean up (injorma。

我始终抱着希望,他仍然活看。

等):Wie need a curtain up there to close out

我想注销我的储蓄胀户。

stop operaring 歇业;关闭:

这么多书乱七八
槽地堆在办公室里让我很厌恶。

cobble sth to gether (informal)

她正慢做恢复自信。

come be fore sb/sth (formaD (of a legal

if it happens
again, weV. come down on you so hard that


兴;流行起束:

要考虑客种各样的因素。

外套掉了一颗纽扣。 2 to faU from sth (从…)

come on/upon sb/sth {Jorma!)

主楼txt文件前10000行里找到的OCR错误,此后的以后再说。

3 个赞

是的,我的模板是211.4m的版。但这本缺了两页。具体忘了。还好你发的那本全,所以校队使用的是你这本。

2 个赞

211.4m的缺两页,489页和490页,488页后莫名的重复出来第22页和58页。正好两页。

3 个赞

你可以找我加空间

4 个赞

纯OCR的文本要想利用起来转成MDX,难免折腾一番,只取词头的话,单词太少而词组内容太长,词组单独提取就必须手工仔细过一遍,况且还有很多OCR错误。先整理了一个单html文件,大家可以用来阅读对比或在此基础上继续修改。

oxford_pvd.html.tar.gz (1.1 MB)

11 个赞

稍微费神,所以我会不定时分阶段做。发现的错误貌似不少,实际上就复杂中英混合文本OCR而言,数据质量是很高的,得花很多力气校对才能达到这个程度,像有些错误,剌(la)和刺(ci),机器容易搞混,肉眼也很难分辨。

oxford_verb_phrases(1-20000行)OCR错误汇总.txt (9.2 KB)

10 个赞

更新一下,20000-30000行的OCR错误。

oxford phrasal verbs (20000-30000行)OCR错误.txt (3.5 KB)

5 个赞

与其花大力气OCR再校对,为什么不做切词版呢,词典准确性永远是第一位的

2 个赞

牛津短语是整合在牛津app里的,得需要破解才能获取数据。小草兄说过要打算破解,但好像没了下文

2 个赞

整合到哪部app里了。来个截屏。

1 个赞