Rawdata_OWPD4th

看群里有人发了光盘文件,就提取了一下,说不定有人感兴趣。
只有Dictionary和Wordfinder部分,没有声音和图片。
声音和图片部分,找起来太费眼睛了。。。
Rawdata_OWPD4th.rar (4.3 MB)

MDX 成品可看这儿:[mdx] Oxford Wordpower Dictionary 4th Edition

3 Likes

感谢楼主分享数据!

1 Like

麻烦楼主抽空看下如下问题,提取的文本中包含很多\si, \sh, \sc, \sm, \s2, \ss, \sn, \so, \sD, \sH, \sI, \s1, \sj, \sk, \sL等内容,总数有16598个,详见下述:

<x eid=“take_196”>\shCome and stay with us any time.\si \shWe\sill take you up on that!\si</x>
<x eid=“tan_14”>You\sire looking very tanned \sm have you been on holiday?</x>

2 Likes

这些是标点符号和特殊字符吧。
对照下光盘自己批量替换一下吧。
比如\si 是 ’

OK,那我自己尝试替换一下。
还有个问题请教一下,文本中音标部分的\u开头的转义字符,如何转换为可见字符?谢谢!
我百度了相关问题,貌似要使用PHP和Java什么的,不懂这些操作。

这个问下论坛上其他人吧,或者你留着这些请大家帮忙。
感觉应该是这个,国际音标unicode扩展表,下面这个网站可以直接搜索unicode和复制音标字符。

做完了能不能发到论坛里呢

OWPD 全名是?

Oxford Wordpower Dictionary

1 Like

楼主,当有人做出来之后,也可以继续保留原始数据的帖子的,这个不影响的,可能有的人还是想要原始数据的。我给你回了一个帖子历史版本。