J̥H́-交流 - 词典软件应用评测之StarDict的前世归纳与今生展望

这个想法是因为昨日寻找GoldenDict alternative的时候,意识到StarDict其实真的已经足够好,而且软件支持方面也非常不错。(虽然,在中国这篇互联网的亚文化区,值得考究的现象是,mdx+的支持比stardict更广泛。(可能是因为开源协议和中国文化不兼容的问题吧))


20200416,StarDict作者胡正应该还在维护词库,能看到他最新分享词典合集是在2019年12月12日。


今天想来探一探 StarDict 的前世今生,希望能有同好一起多多交流。

image
image
image

  • the above images are taken from Wikepedia

稍加了解以后,我甚至有了个观点,放弃mdx返回到StarDict对于非商业需求也是很好的。从干净整洁的角度看,StarDict分别存储

(1). somedict.ifo
(2). somedict.idx or somedict.idx.gz
(3). somedict.dict or somedict.dict.dz
(4). somedict.syn (optional)

并且看得出还支持压缩格式,除了没有像padwiki这样帮助推广mdx的论坛,StarDict和mdx+对比似乎并没有什么劣势却具备其他优势,比如索引与数据分离、同义词/相关词原生支持等等。

并且StarDict不仅支持HTML,还支持XDXF(XML)等。这使得,StarDict比mdx事实上有更强的衍生能力。比如XML对于代码特别友好,比较便于各种搜索(正查、反查等)。

资源整理

Officials

Also Officials

Third Party Dictionary Data

当你是一个会转换已有资源的Picker时,在非StarDict词典论坛可以很轻松的成为小白口中的X大。

Wikipedia Introductions

可用性

Several programs compatible with the StarDict dictionary format are available for different platforms.

For the iPhone, iPod touch and iPad, applications available in the App Store include GuruDic, TouchDict, weDict, Dictionary Universal, Alpus and others, as well as the free iStarDict, which is available for the Cydia Store.

  • from Wikipedia EN StarDict

Android devices can use Alpus, Wordmate or AntTek Dict.
The gTongue Dictionary is also available for Windows Phone.

  • from Wikipedia RU StarDic translated as English

And GoldenDict (on Windows, macOS and Linux) just supports StarDict data files nicely
image

StarDict网站提供的不存在相应的版权问题的词典 - taken from Wikipedia CN StarDict

  • 1913 Webster’s[1]
  • Princeton’s Wordnet[2]
  • Freelang.com dictionaries[3]
  • TU Chemnitz dictionary (e.g. Ding) A German-English dictionary[4]
  • The XML GPL’ed version of Littré.A French-English dictionary[5][6]
  • cedict[7]

可惜作者胡正因为种种原因没有持续维护,从而使得StarDict本体项目青黄不接。

以下来抛抛砖,希望有同好接:brick:

1. 有木有C++玩家,给最新版的macOS Catalina编译一个可用的版本呢?(目前编译好的macOS版本已经很老旧,在macOS Catalina上启动闪崩Crash。)
2. 有没有小伙伴有想法,在mdx中给StarDict杀出一条绿色通道?(整理一条完善的工具链供小白用户使用,从而完善遗落已久的StarDict生态。应该不会就我一个人觉得StarDict不值得被遗忘吧。我甚至觉得mdx流行,而StarDict在国内被遗忘,是个国内文化的讽刺现象。)


if TL;DR, then https://github.com/huzheng001/stardict-3.

3 Likes

https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=13437
总体感觉不太行。开源项目就是这样,没有金主爸爸,核心开发者一走=废弃。

哪里还有今生,死透了

我倒没有把MDict转换成StarDict的需求,不过我觉得StarDict这个从性质上比mdx+mdd好很多的开源项目遗落了有点可惜。所以希望这里呼吁呼吁,希望有志之士能接上。

这点我不认同你。除了中国,除了macOS,其实StarDict还是挺好用的。比如Windows、Linux、Android、iOS等上就有很好的App支持StarDict。
中国以外,mdx其实没有StarDict流行。

没有迁移工具,没比较还说什么好与不好呢

我认为,迁移工具和好与不好没什么关系。好与不好,只要有标准就能评价。(在新时代的中国,我觉得学会正确的思考方式很重要。)另外,没有mdx到stardict的迁移工具,但是有stardict到mdx的迁移工具,你可以品一品,这侧面说明了哪个被奉为老师。

那你的标准是什么?

照你的说法,刚才那帖子的东西不算迁移工具?

感觉你其实还没看我主题帖里面的陈述。
你给的链接更多是workflow,不是迁移工具。

在这里发帖的理性就是点燃:fire:更多人:busts_in_silhouette:的情怀。毕竟我对词典的热爱目前阶段还不足够我大精力的投入,这点比不得nonwill兄。

这两天看XDXF,这格式超适合用来制作词典,不知道为啥被埋没了。为什么StarDict没赢过MDX?搞不清楚。。。有人知道吗?

我觉得这个问题的原因不同人有不同人的理解吧。我觉得部分原因是,胡正本人没有太积极的在国内推广以及其GPL的协议让欧路这类商业团队不敢支持所以就不帮助宣传了。
mdx是个例外,支持起来没有协议问题,因为并没有任何协议保护,虽然是破解的,但事实上甚至比MIT协议还宽松。
另外就是pdawiki论坛的影响了,对mdx推广帮助很多,对stardict就多少没帮助了。

大部分字典都是mdx mdd,有没有办法转stardict?koreader只支持strardict

StarDict 最大的问题是不能像 MDict 一样支持灵活的发音库, MDict 是以链接的方式将发音指向发音库中的任意一个发音文件, 而StarDict中无法自由定义发音指向文件, 必须把发音库中的声音文件名严格的与词头一一对应, 所以, 一个单词如果有多于一个的发音, Stardict就必须多建多于一个的发音库, 而 MDict 只需要在词条中多写一条指向链接, 再者, 例句发音在Stardict中基本就无法实现.

关于StarDict的作者胡正, 如果他当年不要急功近利开始(盗版)词库收费, 从而招致几乎是全世界的唾骂, 而是一直坚持开发至今, 也就没mdx啥事了… 刚去胡正的个人主页看了下, 真的是成大神了…

MDict 有一个对国外用户非常不友好的缺陷, 不过也有可能是作者故意为之, 我曾向作者反映过, 但一直也没见改进, 这个缺陷对国内以中英文为主要使用场景的用户几乎没有影响, 但对一些字母多于26个的语种, MDict 在词头排序处理上有问题, 跟大家基本没关系, 而且也不是什么大问题, 在此就不过多讨论了.

前面有坛友说了, StarDict 只有前世, 已经没有今生, 估计也不再会有来世了, 毕竟, 随着网络和人工智能的进一步发展, 堪用的机器翻译估计在我的有生之年就能够用上, 到时候词典这种东西就会成为语言学家的研究工具而淡出大众的日常使用了.

1 Like

你说的对音频支持的技术缺陷是一个方面。估计也是一开始设计的早,没有考虑语音这个需求,所以支持不够好,而且没有进一步升级完善支持。和你有个看法不同,我觉得还是有今生的。比如iOS等平台都还是有不错的App支持的。而且看不是中国人写的词典推荐文章(我能目之所及的是 德语和英语世界),很多都还是有StarDict的。

StarDict对除了音频(应该说是多媒体)的支持有缺陷外, 其它的基本已经是完美了, 其实我自己也一直在用, 我 iOS 上的Dictionary Universal这个程序用了7,8年, 它只支持StarDict. 国外StarDict用的多的原因应该是它的源码是开放使用的, 而且词库的构建和检索算法几近完美

1 Like

我还没有仔细研究过StarDict格式,不过我在中文世界以外感受到的感觉是,StarDict确实是词典届的上古之王(虽然隔的并没有太长的十几年)。而且,这东西真的是做到的跨国界的一致肯定。情怀以内,我还是希望StarDict能重新活过来的。多推广推广,希望有新的大神Fork一个成功的后继者出来吧。

对了, StarDict 还有一个不算致命的缺陷, 就是处理多词一意的情况比较困难, 其本身是支持的, 但胡正发布的编译程序处理不了, 很多年前网上有一个用Python写的编译程序可以处理, 但估计已经湮灭在时间洪流里了…

1 Like

看StarDict的词典格式本身是可以支持任意发音文件的,要实现自定义发音或者例句发音都没问题,不支持应该是StarDict软件本身的问题,第三方软件可以自己实现一套,就怕不标准。

看你是个技术控,有没有兴趣整理一篇小白可以上手制作StarDict词库的教程出来?