⚜ 70W查词让ЅՕED回到应有的地位+合并Օхford Talking (2700图)

因为pdawiki几乎关站,看见有少数网友发帖求资源,遂备份此贴至freemdict,并继续做少量更新。(由于基于原贴,可能会有一些链接失效。)

简单介绍一下0xford Talking Dictionary。这是1998年,正值互联网泡沫的顶峰,在一片“形势大好”的浪潮中,为“适应新时代”,牛津倾尽资源打造了一款数字化光盘词典——0xford Talking,堪称那个时代造就的绝唱。完整内置了S0ED第4版 (和C0D8,后者容后再述),收录数千条百科词条与2700余张图片。在多媒体刚刚兴起、Windows 95主导桌面的数字启蒙时期,这样一款集声音、图像与文本于一身的作品,无疑是一项技术跃进的象征,堪称当时极为奢华的数字产品。

我在这里把S0ED4替换为最新版的S0ED6 (未包含C0D);并保留所有百科词条和插图。
此外,词典还通过引入W3曲折形态库与talking词典内置变形规则库,并结合内部词组的提取,将词头数量大幅扩展至70万条,很大程度上提升了词典的可查得性。

Oxford Talking Dictionary was originally published in 1998 and designed for windows 95. It fully integrates S0ED4, while over 2,700 vivid photographs and maps added spice to its rigor. Several thousand encyclopedic entries further consummated the platter.

We have now seamlessly replaced the previous SOED4 with SOED6 and meticulously enhanced searchability for both phrases and inflections. It is our hope that these thoughtful refinements will better unveil this old book’s enduring value in a new era.

希望我们的一些小小努力,能让这本经典重新找回它应有的位置,也能帮助更多的学习者勇攀英文的高峰。

SCHILLER

ZEBRA

PORT

Oxford Talking图片举例

图片高清化项目成果举例

SOED的一些用例:

symbol = explaination
= obsolete
eOE = early Old English
OE = Old English
lOE = late Old English
eME = early Middle English
ME = Middle English
lME = late Middle English
14 = 1400-99
15 = 1500-99, etc.
16-18 = 1600-1899, etc.
18- = 1800-present, etc.
-17 = before 1700 (labelling Older Scottish forms)

另外6层义项序号大小(7种序号标识)是按如下逻辑顺序:
1| -A- | I | 1. | a. = a) | (a)
例句独立单列在义项下部分,所以一个总义项下面的顺序是,总义项-分义项-总义项的例句-分义项的例句
其中无标识的例句隶属于主义项 1. 这一层的
标识为a)的例句属于次义项 a. 这一层的

S0ED6来自于Hugh大的版本,排版蓝本基于dfliaoyue改版。0xford Talking文字和图片数据都来自jonah_w提供。jonah_w提供扩容技术支持,kriskr和galcinzhang做了短语提取,志愿者帮助整理了一些LINK信息。

计划更新:
1. 已由Kriskr兄完成。计划进一步提取短语,现在查短语只有跳转,提取之后以后查短语就可以直接显示+跳转。届时将大幅删减多余的跳转。
2. 已完成,感谢V2E和wnsfzf帮助整理额外616个词的其他拼写方法,完成后将整合,提高可查性。
3. 招募志愿者 帮助为2700副插图高清化。Talking词典毕竟年代久远,很多图片其实在互联网上都有更高清的版本。通过谷歌/百度/tineye的图片反查搜索引擎找到高清版本的图片。我会随后替换。如果有兴趣可以私信我。

更新日志:

2025-09-21

  1. 根据反馈,修复引用词条在主词条前的排序问题。
  2. 删除少数明显有问题的@@@link

2025-09-12

  1. 根据 atauzki兄的版本反馈,进一步修复词头重复、空词头、不合理链接等问题,总容量从90W词头精简至约70W词头。词头问题基本得到彻底解决。
  2. 增加少量缺失链接词头如χ。
  3. 继续高清化少量图片,如steenbok, cathedral, boa, gull, tea, peregrine, aircraft carrier, chalet, Alcaatraz, horned, marigold, Pyrenees, kestrel, dandelion, castle, jellyfish, Caernarfon, whitney, Bohr, acropolis, skate, Lavoisier, kudu, Helmholtz, Mayan, convertible, belfry

2021-03-03

  1. 海上1212兄帮忙进一步修复html tag缺失、多余、交叉等问题。并通过代码验证所有标签均闭合。

2020-11-01

  1. Kriskr兄帮忙删除不恰当的词条重定向,深度提取词组。
  2. 一些图片更新成了高清版本

2019-10-30

  1. 调整序号排列,增加a) b) c)逻辑层

2019-10-27

  1. 修正数个排版的小问题
  2. 修正256楼提出的多词条欧路跳转不畅的问题

2019-10-26 初版

  1. 修复巨量的html错误,包含未闭合html tag,为之后提取短语铺平道路
  2. 让6层义项层次符合逻辑
  3. 合并Oxford Talking百科词条和插图
  4. 增加跳转(之后会继续精简)

SØED6+ØTD.txt (151 Bytes)

14 个赞

再看一次也是觉得很有价值。赞:+1:

老大辛苦了!

感谢老大,全文认真学习了,拜读!!

还有一种修订版,不过不是基于2021-03-03版。供参考。

1 个赞

昨天也忽然看见了,我计划拆包琢磨下把这两版合并一下。 atauzki大应该就是删掉了一些冗余的@@@LINK的词头

我下载该版本使用,发现短语词组提取了两次,其中之一因html结构问题不显示,还有一个是指向原词头的;talking词典内容部分有图片,但图片是单独词条,没结合进文字词条中。对此进行精简,去掉曲折变化扩充的词条;去掉提取的短语词条,只保留指向的词条;去掉图片词条。得词条总数 253706,其中主词条 153939条,短语和派生词 99767条。

这确实是SOED6最大的问题,不过也是我这个改版最主要的工作,大多数的未闭合的部分我都处理了,可以测试看看。

4 个赞

SOED4 原来有一个mdx版本,看来词条内容不全,排版也不好,让我误以为词典就那样,误事。
尝试从app提取cod12的文本,获得结果不全,结论是app没有一次性装入所有词条(可能是非注册版本的原因?)。SOED6目前的版本可以说已令人满意。

1 个赞

分块读入内存,通过索引表提供的偏移量确认具体显示词条不是很常见的事情吗?怎么可能整个辞典经过一次查询就全都读到内存里。。。你不知道某笛的格式多复杂,这过程要进行多少处理,这样性能开销太大了。以及只读到纯文本的话,进行这样提取确实意义不大。

cod12 格式比较简单,如能获取所有词条的文本,已经足够。

谢谢更新。

网速OK的话,可以考虑使用本论坛网盘,需要重新注册

已在FreeMdict Cloud上传,新链接也更新在txt文件里了。

5 个赞

小白弱弱问一句,有的时候感觉返回的查词结果挺迷的,会有一些相关的单词但是不知道为什么会出现。是不是原光盘软件就是这样?

查principal,会出来head。而在head的解释里面,出现principal的地方,只有一两个地方,是不是释义B里面这个地方让head关联了principal?

另外,曲折变化有的时候也是让我没脾气了 :anguished_face:
是不是因为把Ares看成are的复数,然后are是be动词,而SOED里面提到bee的古弗里斯兰语形式是be,所以查Ares阿瑞斯的时候会出来bee蜜蜂?

主要是他的功劳,他做的词典都这样,扩容很暴力

2 个赞

我觉得母语型词典,不应该人为加曲折词。正常变化的时态曲折词只有初学者才需要,而初学者是不会用母语型词典的。

1 个赞

:sweat_smile: 之前已经尽力改了一些了,这里我也又更新了一版(9月14日版)

另外关于principal和head的问题,我这里GoldenDict查出来是这样,后面head的主词条是不出现的。

1 个赞

是啊,有时觉得加了曲折词头反而不方便。

比如,我在Kindle上通读词典,就是一个单词一个单词地看下去。

如果加了曲折词头,像MAX系列Kindle词典,就会有好多个词头重复着同样的内容,look、looks、looking、lookings、looked等等都是look的内容;我要翻好多页才能翻到下一个单词。

不过,有的词典的曲折变化不是加词头来实现的,可能是用专门的曲折库来重定向,像牛津高阶英汉双解词典第7版mobi(现代版) Kindle,就非常适合通读。虽然我钟爱longman,但是在Kindle上通读词典,还是这个系列的牛津方便多了。

:sweat_smile:已经更新到9月12日最新版,还是会出来head词条。可能是欧路的问题?不得而知了。

我记得MAX和jonah_w都用的W3曲折库 :laughing:,这玩意质量就那样。就算是对的,因为W3是本上世纪的足本词典的原因,也会融入一大堆过时的古旧罕见的曲折变形。jonah_w的一大堆冗余扩容都被很多人诟病过了。(当然可能是他自己又做了些工作,不是W3曲折库的问题)

这对学英文的也是鸡肋,食之无肉、弃之有味,曲折变形都在词语末尾,还非常的规则,你自己都能划词选到正确的主干。不像有些语言有复杂变位或者日语的活用形,你压根都不好划词,我觉得那种才真的需要。不在划词场景的话,我真想不到谁会在日常普通查词输入变形词而不是原型。

W3曲折库,久仰大名已久了,在PDAwiki的原帖都找不到了,也没下载过。 :face_with_raised_eyebrow:不知道具体是什么规则,不知道怎么做出来的。