【筹划】Webster's New Dictionary of Synonyms双解版

linbai · 2020 年4 月 25 日 21:34

大家都知道，Webster’s New Dictionary of Synonyms有个中文翻译版，是英语同义词辨析大词典。

整理之后发现，作者实际翻译过的词条大概只有2293条。数量并不多，所以顿时感觉有整合到Webster’s New Dictionary of Synonyms中的可能性。
不知道大家有没有兴趣一起来搞一下？万一实现了呢。

qujinzhi · 2020 年4 月 25 日 23:37

坚决支持！只要把识别后的中文匹配到英文原版后面就可以了，不过我印象中似乎中文翻译例句要多一些。

W2K · 2020 年4 月 26 日 00:44

对不上。
英文版是母本不假，可中文版是有取舍的，还加了些别的词典的内容，用了就知道了。
做的话也是wzy老师的韦氏同义词辨析版本，但大多数内容是重合的。

qujinzhi · 2020 年4 月 26 日 01:04

我也是对比过发现不能完全对上，但是大部分还是可以的，这样也可以匹配。

spiderman · 2020 年4 月 26 日 01:55

请问可以补档切图版吗？感谢

Vim · 2020 年4 月 26 日 03:42

并列查询就可以啊，虽然不是最方便，但是最准确。准确性超越便利性。

awk · 2020 年4 月 26 日 03:44

支持, 支持首先单独且尽可能完整准确地做出王版英汉(部分)

endnote · 2020 年4 月 27 日 02:35

这是网页还是软件包？

貌似python有模糊匹配的解决方案，然后在人工校对一下

Yyang · 2020 年5 月 7 日 01:33

楼主有没有想ocr其他切图版本的词典？
比如蓝登书屋韦氏英汉大学词典 ENCARTA英汉双解大词典英语搭配大词典(增订版)王文昌
或者能否帮忙ocr一下啊，乐意支付其费用～

W2K · 2020 年5 月 7 日 07:31

WangSYN_over.html.rar (16.7 MB)
带格式。准确率没你的好，人多了校对下应行。

W2K · 2020 年5 月 7 日 07:56

ABBYY FineReader就是莫名其妙的空格和分段，要不可以减少很多校对的事。

把.html改成txt用文本编辑器打开随意加改标签，完事再改回来.html在ie里校对流畅度还行。

endnote · 2020 年5 月 7 日 07:59

这样子确实方便人工校对。
然后就是把汉语部分插入英文版了

W2K · 2020 年5 月 7 日 08:24

别想了，他这本是大杂烩（删减例句数量引入use the right word的内容）。你的想法可以在读者文摘那本use the right word上实现，因为那本是按原书出的汉译版（正体字，港人的语言习惯，整体来说质量还不错）。

这本只能是王正元老师的韦氏辨析双解了。

endnote · 2020 年5 月 7 日 10:55

ocr是第一步，排版加HTML标签才是麻烦。

Yyang · 2020 年5 月 7 日 10:56

好的！谢谢！现在在弄吗？搞着玩意我在行

W2K · 2020 年5 月 7 日 11:20

起初的想法看一遍连校对也完事了。
既然大家都喜欢我就发到论坛。
一天看点对着切图的词典速度还行，要是人多一起弄的话把我分的那些标签再明确下。

里面就类似于这样释义例句参杂一起的不大好分。其它的就直接往下一段解释一段例句的很有规律，再有就是几个词放一起比较时分着费点事。

Arlin · 2020 年5 月 7 日 11:36

我只ocr了一个字母，想每天用的时候校对，结果真的也就是想想…哈哈。
快来个人分工吧！

W2K · 2020 年5 月 7 日 11:50

我自己弄也就无所谓了，要是一起弄还是找个做过词典的主持下，要不浪费大家感情。
要是就咱俩可以一人一个字母用我现在这个ie校对就行，然后往一块拼一下慢慢弄，也就当看一遍书了。

Yyang · 2020 年5 月 7 日 12:28

直接开始吧先处理数据先统一下结构标签，后面人工校对就行了
组织人吧几个人足够了

Yyang · 2020 年5 月 8 日 01:19

你们不要弄了我一个人来不然重复劳动…