试手Longman dictionary of English language and culture

2026.4.9 更新:补全完整 英文第三版 2005 OCR 原始文件,一共1682页,1682个txt文件,已核对完整性,未核对内容(用最新ai OCR的,质量应该是有保证的)。

LDELC_3rd_2005_en_OCR_txt.zip (6.2 MB)

2026.4.9 同时更新:简体中文2004年商务印书馆版 OCR 原始单txt文件,从词头第一页也就是31页到2252页。
LDELC2004商务版(对应英文2002版).zip (9.1 MB)


Ai OCR 的效果真不错

Ai 转换为 jsonl格式

jsonl格式转换为easydict词典

4 Likes

:exploding_head:这是从图片一步步转过来的吗

:grinning_face_with_smiling_eyes: 是的是的是的

1 Like

感觉好大的工作量

有ai的帮助就容易多了,只是比较费tokens

原来有人做了,立马动力少了 :relieved_face:

双语版和英英版不冲突,况且双语版是没公开分享的
英英版好像还没人做过

双语版是纸质词典OCR开始制作的还是基于电子数据?

电子数据,应该是从电子辞典提取的数据

这是开山之作,值得!

那这个准确度高

:grinning_face_with_smiling_eyes: 那我就再加把劲,争取早日面世!

1 Like

1)这个登入后50頁/天(free)

2)JSON结果用批处理很容易分开左栏、右栏

3)你看中文能灌进去么?

wordslist - 001–500.txt (4.8 MB)

你好,反馈个问题
剑桥词典的这个more_examples和sense并列了

正确位置应该是放在sense里的data里

又或是说,这个词典结构就需要如此?


以及group_name的字段不用加粗,软件会自动给他分配600字重的

收到,我来修正

求一个双语版,羡慕这本已久,能分享不?

已修正。已上传到词典商店。

2 Likes

Where to download?

Longman dictionary of English language and culture 这个词典还没制作出来。

上图的是另外一部词典CECD 剑桥,从mdx转的

1 Like

OCR后 检查发现 大量txt 内容不完整 :sob: