全面拆解词典 FF LDOCE5++ En-Cn V2.15 提取其中各种元素

抽空把 FF 经典的 LDOCE5++ En-Cn V2.15 拆解了



9 Likes

图二很适合制作anki

1 Like

这个工作很有意义,应该是学习 NoSQL 的好案例,好像首选是 MongoDB

1 Like

赞,一直希望有人干这事 :grinning:
可以方便地制作一词一句一义的anki卡片。

数据库总共4.05G,共1133680 条数据,其中:总例句数:622273 有声例句:107216 ,无声例句:515057 汉译有发音例句总数:106016,汉译无发音例句总数:12579,有发音未汉译例句总数:1200,语料库例句总数:458342,错误示范例句总数:684,无发音无汉译例句总数:43452

人工无法校对

2 Likes

用的是什么数据库格式?

3 Likes

我说我留言的信息过时了,删掉了,不是说楼主:face_with_peeking_eye:

楼主可以分享一下拆解数据嘛?感谢!

能把商务词典单独提取出来吗?