Missing the mdd for image and audio, but here is the tabbed version:
Downloaded images etc, but slow upload hampers sharing anything large. Will keep trying.
Hats off to you!
Thanks a lot!
谢谢你的资源分享。
新货来了,可以整整:
应该还没发完,还有英和和英。
不晓得为啥看不到这个大文件mdx帖子(估计是下沉很快)
看了一下,有点糊涂,比如 “㹭” 词条下的内容不知道如何切割??目测几十页内容。
是以前kotobank的帖子直接改的,更改主贴不会被顶上去,改回复会。
你帮我看看这个词条内容如何切割? 㹭
别的汉字都是多余的,去掉就可以。按词典分割。
舍不得去掉,先保留,假设里面应该是无数个独立的词条(被塞进去错误的词头)
然后再去重。
你知道两个mdx的差别么?第二个在rar里面,大三倍,以例句为主。是不是都是同一个网站的,内容为啥分开来?
没下载过,没研究过。
下载了。不过本人实属小白,没看出来两个大小不同的文件有什么区别。期待和英·英和发布的信息。多谢。
你想做语料库的 话我把例句 链接 发给你 大概5亿左右 你自己下
日英大概 超10亿吧
词典内容过大的话 出典:Wiktionary 这部分不要 就行 日英出典:Wiktionary 这部分也大
语料库okayer在做,你可以私信给他,只是不知道还上不上论坛。
tio.freemdict.com
我就处理一下你的数据即可,我也不识字(日语),另外如果没有账号也不行。
估计源数据体积至少10gb以上。
期待。例句是学习的好内容,可以模仿造句,提高规范表达水平。
看上去不错,有空可以弄一下(二好像不清楚如何tab,一部分重叠以前做的英汉汉英合集)。下载了freemdict 的尚未整理文件夹, 390GB
多谢整理,大神!
大神,Oxford的相关英语书籍看起来种类繁多,能否整理出Oxford的系列词典进行tab?