关于制作牛津初阶英语词典的事项

mdx一直缺乏初阶词典,前人已经有了牛津初阶英语词典的英文版本,对应的双解版本一直没有,感觉繁体双解光盘得到的可能性也不大,有没有可能ocr一下双解pdf,看看能不能配合英文版本得到一个合适的版本。

牛津初阶英文光盘: Index of /dict_iso/oxford essential/
mdx 语音版本: [Oxford Essential Dictionary voice edition - 英英 - FreeMdict Forum]
(Oxford Essential Dictionary voice edition)
牛津初阶英汉双解pdf:我用夸克网盘分享了「牛津初阶英汉双解词典 第4版 2017(2).pdf」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。
链接:夸克网盘分享
大神有空帮忙ocr一下,最好带词头的文本,方便制作

@amob 好像分享过万邦app的数据。

这个链接吗: Niu2jin1chu1jie1原始数据 - 技术交流与词典编修 - FreeMdict Forum
数据分项已经取消了。

有人制作了,没分享

早有在线网站了,虽然做得一般。

编辑助手平台

“你不是vip,无权限” :grimacing:

辛辛苦苦做出来的词典自己用也正常。如果能交换,我相信人家是愿意交换的。

看了下介绍有很多小语种词典啊,这个权限怎么获取的?有几本我都ocr了,已经有了词头,能爬一下数据的话就不用校对了。

数据好像不全,我随便查了几个《新时代俄汉详解大词典》的词都没结果,《古希腊语汉语词典》也是,感觉对非拉丁字母支持有问题。《土耳其语汉语词典》、《新捷汉词典》、《葡汉词典》、《意汉词典》都有结果。

忘了,是机构用户才能用

看看这个牛津双解pdf能帮忙ocr一下不,我自己ocr的不好。谢谢

这个可以先用夸克ocr一下,gemini现在砍了好多免费额度,用cli的话比较慢。

我看了下,这个是第四版,但现在已经有第五版了,没必要ocr第四版。

现在借助AI朗文多功能5是不是能完全文本化了

这个可以在多功能5下面跟贴 ,一起助力

试着用夸克ocr txt,手工弄了A字段的文本,感觉还行。

第四版,因为要配合这个英文版。

其实这个小词典看纸质版最好了。没必要做个电子版。因为词条释义都很短又核心,背下来就行了。

牛津初阶_A字母单词本.txt (53.4 KB)

1 Like

我没填机构邀请码也注册成功了,但这数据质量太差劲了,甚至不如ocr的版本,估计根本没考虑小语种,文字都是乱码,怪不得非拉丁字母基本都搜不到。

土耳其语的

俄语词头都是乱码

字体混淆技术很差劲,把数据弄烂了。