他是针对hanyl05的朗6mdx而言吧
其实根据ff大抓取的日期来看,他的版本英文部分就是官网朗6,只不过没有朗6新添部分的汉语译文
What is LLA?
这是hanyl05搞的早期朗文版本吧?你自己看看词典描述,用这个不如它的后期版本朗6++3.0呢
貌似没有人提取金山词霸的朗6吧?这实际是朗5吧?你自己搜一搜朗6新添词都是没有的。
老实说一直没看到有道原生提取朗文5较优版本,hanyl05我一直不太看好。
ff的版本已经基本完美了,唯一缺憾是这个版本是网站爬虫来的,
而目前多见的朗6英文版多是光盘提取,有更强大的功能(顶部的thesaurus,collocations,examples,这是遍历整个词典和语料库搞来的,相当全,目前虽然有单独的extras的mdx,但是还是有差距,没有thesaurus内容)。只要有人增补进这些东西再粗略匹配译文就可以了。
如果有人有精力,比起另做一个版本,不如把ff版本的译文人工更新成朗文6的,之前貌似见过图片版mdx,可以方便校对,如果有人可以发出来就好了
目前我只知道meigenchou大和阿弥陀佛会提取,他们掌握这个技术都是2021年的事了…详见新法汉词典,阿弥陀佛估计是他教的
别对hanyl05期望过高,海笛app提取哪有那么容易
他真会提取的话早就被提取光了,每一个标99元出来卖
看到坛里的柯8是纯文本加标签想来真是不容易,早就有大神掌握了原数据提取,详情见三省堂国语辞典和明镜国语辞典
meigen大算是技术顶流,自己还在捣鼓新词典格式,详情见他博客,很多最新词典数据他早就有了,他在坛里发的一些回复也能看出来还在研究,也提到了他的格式的优势
有缺词问题,不太建议吧
可能有人发过有道朗5,ff基于此做的
或者可能ff自己另外去提取的,那这就没办法了
最好还是别用hanyl05的
讨论也是有意义的,可以让后来者能更深入了解各个版本mdx
吃茶吃茶,
三国7就是m大的
非常感谢分享!
非常感谢!!