英语常用词疑难用法手册文字版mdx 6.3更新

大模型很容易出这种问题,所以一般要两个以上模型对比查错,几个模型都错同一个地方概率不大

Gemini识别的,你发的几处基本对文意理解不构成影响,所以我不准备改掉文本。
不放心的话可以跟图片版一起用,或者再做一个图文综合版,我目前没有这个打算,因为现在对我已经够用了。

我不是让你换掉,我只是打听一下是不是有了新版。因为我感觉这些不一致的地方貌似语义上说得通。不过,话说回来,上面这些不是真的大毛病,纯属好奇。真正大毛病是你很多文章不完整,截断了。

对,我也想知道是AI幻觉,还是出了新版。

行吧,你确定mdx用的是最新的版本吗,因为我前天放了一个新版,处理了一些截断的文本,我再查查。

1 Like

确定,今天下载的。所以这些不一致的确是AI幻觉而非出了新版,对吗?

是幻觉,之前已经被指出了

哦,那数据就不可靠了。

之前已经有人反复指出了,这就是ocr文本,不知道你纠结这个干什么,如果你纠结是否准确,那可以说,所有论坛里的ocr词典都不可能是百分百准确,都只是够用而已。如果你想用准确的,用之前的图片版吧,因为我补齐之后同样不可能实现你口中的「可靠」,因为这不是我的责任。

1 Like

英语常用词疑难用法手册_634_645_completed_bundle.zip (3.3 MB)
补上了找到的截断,有需求改的,自己动手吧。我其实没怎么用过这本词典。

3 Likes

请问@wynick27 大佬能出手校订一下文本吗?

1 Like

我可以帮忙再用paddleocr识别一遍。这个没有原始文本,我现在写的校对工具也不支持有样式的mdx词条和无样式直接对比,不过这个也是可以改进的。以前第一版pdawiki能能凑到很多人校对,现在我觉得也可以搞合作校对,我目前开了好几个日语词典的坑,这个暂时没时间弄。

补了一个paddleocr的结果
英语常用疑难词用法手册_paddleocr.txt (3.5 MB)
英语常用疑难词用法手册_paddleocr.7z (2.2 MB)

3 Likes