“简繁通搜”:“在软件层面实现”与“在数据层面实现”的差异。

你可以列举一个被毁掉的实例,或者上传一个mdx文件,否则没有任何说服力。
我这里词典内的跳转是<a href="entry:……</a>的形式,索引是@@@LINK=的形式,根本不存在混淆的情况。

发现你们讲的就不是同一件事情,你讲的是解开包以后,跳转词头可以很容易清理。
另一位讲的却是不解包,只用软件查询的情况下想分辨出很难。 :sweat_smile:

我上面19楼的回答说了,以“乾坤”为例,假若加入了一个错误简体索引“干坤”,则在软件中检索“干坤”时将被指向正确的词语“乾坤”,这就是分辨了“乾坤”为词典内容,“干坤”为索引。
我举一个例子把:

在没有繁简通搜功能的软件中,为mdx加入繁简索引,我认为很方便,而且没有破坏原有的数据。

先生总结得极是。
我们下载mdx,绝大多数情况下,是为了直接查询使用,而非为了逐个拆解,技术分析XML原始数据。
还是回到主帖讨论的问题吧。

“在软件层面实现”的【简繁通搜】,词典本身——无论是正文或者词头索引——绝不呈现任何人为的、机械添加的、主动产生的简繁转换错误内容。用户在【搜索关键字文本框】内输入错误词头“干坤”,词典自动跳转至正确释义“乾坤”,在这整个过程当中,mdx词典本身并不显示任何错误。“干坤→乾坤”的内部跳转,对于用户而言是完全透明的,用户看不到任何错字、错词。

而在数据层面实现的【简繁通搜】,则可能会呈现出大量错误词头给用户。
比方说,用户在【搜索关键字文本框】内输入“干”,下边的【简繁通搜】列表可能会列出一大堆的错误词头,与正确的词头混杂在一起,无任何明显标志(比如,小两号字、斜体、红字或标一粒小星之类)可一眼区分,这其实对于“眼尖”或“强迫症”的用户,是一种残酷折磨,可能会引发灵魂拷问——
“怎么回事?怎么会有【干造】、【干竺】、【干清宫】、……我要不要点进去,赶紧严肃地确认一下:究竟我的语文是体育老师教的,还是音乐老师教的?”
情形大致相当于,你从新华书店的专业书架抽出一本厚词典,查目录发现了一大堆错字,赶紧翻到正文,发现正文却无误……然后惊见粗黑体《编者的话》,大言不惭宣告:

目录错误,这是已知的一个微小问题,根本就算不得什么见不得人的错误,官方确认:这绝对不能算是毁词典!

pc版mdict的繁简通搜就很不错。以前一直一位goldendict软件本身没有繁简通搜功能,刚刚知道其实也有,但默认是取消了这个功能的,可在“词典——词典来源——转写”中设置即可,而且通搜效果很不错。虽然很多人可能都知道,但对我来说确实是“新发现”,分享一下。

上面的争论有点激烈,让我刨的有点犹豫,不过我确实有一点上面没说到的东西想说

楼主说繁简转换是不好的,因为无法复原,但是世界上少有什么东西是真正可以复原的,数据的确是少有的长久保留不变的东西,但是经过一个个人的修订(不管好的修订还是坏的修订)终归没法原样变回去
如果要真的让数据可以还原,当然也有办法,可以使用版本管理软件记录源数据和进行过的改动,但是这当然也是有成本的

对于转换之后塞进词条,我也有些洁癖,我也认为是不好的,但不是因为这无法复原(真的无法复原吗,其实只是需要花费额外的校订成本罢了),而是因为这不是好的改动,应该说有更好的做法
楼主提出可以让软件来做跳转,这是一种好的做法。还有其他做法可以参考,我们可以外置一个词典,类似 Golden Dict 内置的构词法功能,或者类似 JumpToDict 那样的词典,维护一个独立的对应关系而不用直接在原本的词典上作改动,当然这些也都是有成本的

但是对于不了解其他方法,或者没有足够的心力去那么做的人来说,我觉得不应该去苛责他们,毕竟 “毁” 这个字太重了