“简繁通搜”：“在软件层面实现”与“在数据层面实现”的差异。

doublex640 · 2023 年2 月 19 日 14:23

你可以列举一个被毁掉的实例，或者上传一个mdx文件，否则没有任何说服力。
我这里词典内的跳转是<a href="entry:……</a>的形式，索引是@@@LINK=的形式，根本不存在混淆的情况。

zhongx · 2023 年2 月 19 日 14:24

发现你们讲的就不是同一件事情，你讲的是解开包以后，跳转词头可以很容易清理。
另一位讲的却是不解包，只用软件查询的情况下想分辨出很难。

doublex640 · 2023 年2 月 19 日 14:32

我上面19楼的回答说了，以“乾坤”为例，假若加入了一个错误简体索引“干坤”，则在软件中检索“干坤”时将被指向正确的词语“乾坤”，这就是分辨了“乾坤”为词典内容，“干坤”为索引。
我举一个例子把：

在没有繁简通搜功能的软件中，为mdx加入繁简索引，我认为很方便，而且没有破坏原有的数据。

myfav · 2023 年2 月 19 日 14:55

先生总结得极是。
我们下载mdx，绝大多数情况下，是为了直接查询使用，而非为了逐个拆解，技术分析XML原始数据。
还是回到主帖讨论的问题吧。

“在软件层面实现”的【简繁通搜】，词典本身——无论是正文或者词头索引——绝不呈现任何人为的、机械添加的、主动产生的简繁转换错误内容。用户在【搜索关键字文本框】内输入错误词头“干坤”，词典自动跳转至正确释义“乾坤”，在这整个过程当中，mdx词典本身并不显示任何错误。“干坤→乾坤”的内部跳转，对于用户而言是完全透明的，用户看不到任何错字、错词。

而在数据层面实现的【简繁通搜】，则可能会呈现出大量错误词头给用户。
比方说，用户在【搜索关键字文本框】内输入“干”，下边的【简繁通搜】列表可能会列出一大堆的错误词头，与正确的词头混杂在一起，无任何明显标志（比如，小两号字、斜体、红字或标一粒小星之类）可一眼区分，这其实对于“眼尖”或“强迫症”的用户，是一种残酷折磨，可能会引发灵魂拷问——
“怎么回事？怎么会有【干造】、【干竺】、【干清宫】、……我要不要点进去，赶紧严肃地确认一下：究竟我的语文是体育老师教的，还是音乐老师教的？”
情形大致相当于，你从新华书店的专业书架抽出一本厚词典，查目录发现了一大堆错字，赶紧翻到正文，发现正文却无误……然后惊见粗黑体《编者的话》，大言不惭宣告：

目录错误，这是已知的一个微小问题，根本就算不得什么见不得人的错误，官方确认：这绝对不能算是毁词典！

aimdict · 2023 年2 月 21 日 12:42

pc版mdict的繁简通搜就很不错。以前一直一位goldendict软件本身没有繁简通搜功能，刚刚知道其实也有，但默认是取消了这个功能的，可在“词典——词典来源——转写”中设置即可，而且通搜效果很不错。虽然很多人可能都知道，但对我来说确实是“新发现”，分享一下。

H4M5TER · 2023 年4 月 5 日 15:08

上面的争论有点激烈，让我刨的有点犹豫，不过我确实有一点上面没说到的东西想说

楼主说繁简转换是不好的，因为无法复原，但是世界上少有什么东西是真正可以复原的，数据的确是少有的长久保留不变的东西，但是经过一个个人的修订（不管好的修订还是坏的修订）终归没法原样变回去
如果要真的让数据可以还原，当然也有办法，可以使用版本管理软件记录源数据和进行过的改动，但是这当然也是有成本的

对于转换之后塞进词条，我也有些洁癖，我也认为是不好的，但不是因为这无法复原（真的无法复原吗，其实只是需要花费额外的校订成本罢了），而是因为这不是好的改动，应该说有更好的做法
楼主提出可以让软件来做跳转，这是一种好的做法。还有其他做法可以参考，我们可以外置一个词典，类似 Golden Dict 内置的构词法功能，或者类似 JumpToDict 那样的词典，维护一个独立的对应关系而不用直接在原本的词典上作改动，当然这些也都是有成本的

但是对于不了解其他方法，或者没有足够的心力去那么做的人来说，我觉得不应该去苛责他们，毕竟 “毁” 这个字太重了