发布《简明西汉汉西词典》 从灵格斯的词典重新制作

这个词典的mdx版在网上存在很久了。为什么我还要再制作一个呢?

我在网上能找到的几个版本多多少少都存在问题。

其中一个版本是隔壁论坛zhlpen发布的。主要问题是不管搜索单词的任何变化形式,结果都是你搜索的这个形式,不会显示单词的原形。而且如果你搜索的单词的变化形式正好是其它单词的原形的时候(这种情况很常见),结果会混合在一起。

另一个是更早时间 Philostone制作的版本。主要问题是除了有上面的问题外,所有内容都放在一行根本看不清楚,而且所有的特殊字符全部变成了问号,相关词条显示不正确,也无法被搜索,所以没有实用价值。

我最早下载这些版本的时候还不会西班牙语,现在已经会一些野生的西班牙语了,也没有看到更好的版本出来。所以自己做了一个。

我的这个版本直接从灵格斯词典转换过来,经过一番努力,解决了这些问题,基本按照了它在灵格斯词典中的风格,保持了原词典中所有的词头,顺便修正了原来词典中的几处错误,并提供了css文件供个性化。

下面几个截图能反映出我的版本和其它版本的区别:


这是我制作的第一个mdx词典。请大家指正。
用西班牙语的人应该不多,请需要的朋友下载。如果发现错误请给我留言,我会在下一个版本修改。

此处下载:
2022.11.14
v0.77 修正了之前转换时不小心造成的几十处错误。修正了个别原词典的错误。补充了缺少的约800个词头(主要是一些阳性形容词、名词对应的阴性词)。
简明西汉汉西词典_shtjjh v0.77.zip (3.2 MB)
2020.11.09
v0.76 修正一些错别字
2020.11.02
v0.75 修正一些错别字
2020.08.12
v0.73 修正几处错别字
2020.08.07
v0.72 初版

最近发现这个词典应该是出于外研社《现代西汉汉西词典》的一个比较早的版本(可能是91年版),去掉了例句部分,而且缺少a开头的少量单词。网上有它10年左右的一个苹果app的无密码数据,有空我会补上缺少的部分。不知道最近有人传到论坛的是什么版本,链接已经失效我没有下载到。目前它的新版有纸质版,安卓版和苹果版,还增加了一些词条。但是目前的安卓版和苹果版的数据是有密码的,应该是 SQLCipher加密的。


顺便提一下“西语助手”:
它的西汉词典部分主要是82年版新西汉词典。我设法扒了它的全部内容,想用它来和隔壁论坛zhlpen发布的未完成校对版新西汉词典相互校对,整理出82年版新西汉词典的文字版mdx词典。

结果发现“西语助手”的错误不是一般地多,我初步估计有上万个错误都不止。不仅错别字无数,词头不正确的也很多,还有同时正确不正确的词头同时存在的情况也很多,还有个别词典上有它没收录的情况。当然它也另外收录了一些82年版新西汉词典没有的词。它的网页上号称提交10个错误就可获得注册码。我若提交的话岂不是能赚辆车了?不过我也没有去尝试。这样的东西卖128元真的没问题?

快照1

zhlpen发布的未完成校对版新西汉词典的错误也非常多。可能当年的ocr软件水平不行,另外可能源图也不是很清晰。不如自己重新ocr后和“西语助手”比较会比较容易。不过无论如何,光是8万多个词头校对一遍就很伤脑筋,一个人做的话没有几个月半年是无法完成校对的。所以暂时搁置此想法。

最近想到有道词典似乎很牛的样子,出于好奇,看了一下它的西语部分。发现它也用了一部分82年版新西汉词典的词条,但又不是全部,即使在一个词条内有的内容也没有完整收录,比如第1条a:


还有它收录的词条数也很少,我随即查找了20多个词有部分没查到。得出的结论就一个字:渣。毕竟西语词典不是有道的主业,建议学习西语的人远离有道辞典。

17 个赞

有志者事竟成。

1 个赞

谢谢提供!Te daré mi retroalimentación tan pronto como pueda.

Muchas gracias.

楼主,发现这里一个词头错误

1 个赞

原来还以为西语助手是最好的,没想到做的这么粗糙。我建议LZ向他们反应一下这些翻译问题,看看他们的态度。

1 个赞

谢谢指出!我发现这是我转制时不慎眼花造成的错误。原文件是对的。
现已修改,顺便改了最近发现的其它小错误。

请从一楼下载新版。

1 个赞

其实用用应该也还可以吧。毕竟不少错误在不怎么常用的词上面。一般使用并不容易发现。另外它也还有一些其它功能。不过我没有空去联系他们,也不想帮他们改进。

我曾经觉得西语助手是最好的,一直都希望能用西语助手的数据做一部MDX西汉字典;原来82年版新西汉词典才是蓝本。希望LZ最终的大作能在数据质量上超越西语助手。

请问你有没有新西汉的词头

1 个赞

楼主,我也发现一个词头错误

谢谢反馈,已改好。见一楼。

能否简介一下制作流程,写个简明教程则更佳。

1 个赞

没什么特殊流程。当初提取数据是网上找现成的工具。接下来就是整理mdx的一些常规操作。

感谢优化,正好需要,谢谢