《新时代汉英大词典》资料梳理

shaoshi · 2024 年7 月 3 日 15:48

所以使用这种加密字体的词典，是没有通用的替换表的？每部词典都可以出现新的变化？

每部词典得重新人工替换？

last_idol · 2024 年7 月 3 日 16:10

不知道，但是这种静态字体加密的方式有点过时了，随时可能会升级，现在都是动态字体加密，破解方需要自己训练识别，而且不能保证 100% 还原。珍惜现在的美好时光吧。。

last_idol · 2024 年7 月 3 日 16:38

这种就是没加密。

匿名1708 · 2024 年7 月 3 日 16:42

xml 版的辞源也没加密

                <YiXiang> 竟，乃。 <ShuZheng><Q>戰國策</Q><Q>齊</Q>一：“<Z>靖郭君</Z>之於寡人，一至此乎！”</ShuZheng></YiXiang>
                <YiXiang> 助詞。用以加強語氣。 <ShuZheng><Q>管子</Q><Q>霸形</Q>：“今<Z>楚王</Z>之善寡人一甚矣。”</ShuZheng><ShuZheng><Q>戰國策</Q><Q>燕</Q>一：“此一何慶弔相隨之速也。”</ShuZheng></YiXiang>
                <YiXiang> 樂譜記音符號之一。詳“<LianJie link="82114696-J4X6G3">管色譜</LianJie>”。</YiXiang>

主要是清理私有字的过程探索下能不能自动化，以及xml有缺数据的，用网页版可以补补，目前加密的就看到一个网页版辞源。

shaoshi · 2024 年7 月 4 日 07:02

我试了一下这个方法。把私用字贴到检索框里，就会显示正确的字。

假如再检索，会得到《现汉》的词条。

但是，不管是检索框里的字，还是网页《现汉》显示出来的字，都仍然是私用字。

假如复制回来，还是私用字。

仍然得自己找Unicode编码。

唯一的好处是不必猜是什么字。

已经有M.C的xh7文本了。这个字xh7假如有，可以再查xh7的mdx，看Unicode是什么。mdx用的是Unicode。

但是我自己有一个Access的汉字资料库，已经相当完备了，能用两分法找Unicode。所以就不用这个方法了。

其他人可以考虑用叶典。叶典网站慢得很，但坛里有佛爷做的叶典mdx。

假如是正文里的私用字，可以看词头是什么，查K大的mdx。K大的mdx已经转换成了Unicode。

shaoshi · 2024 年7 月 5 日 08:34

写了上面的帖子后，因为提到M.C的《现汉7》，忽然灵光乍现，想到了解决问题的办法。

<ci>〖锕〗</ci>
<yiti>（錒）</yiti>

《新时代》有私用字的词头多数是类推简化字，但是所附上的繁体字多数是Unicode。

由此可以做出一个繁体字和类推简化字(私用字)的表。

M.C的《现汉7》是Unicode词头，有许多类推简化字，另外做了繁体字的跳转，跳到类推简化字的词头。

㑳
@@@LINK=㑇

这些跳转可以做成另一个繁体字和类推简化字(Unicode)的表。

把两个表在数据库里联系起来，在繁体字上做链接，就可以得出一个“类推简化字(私用字)”到“类推简化字(Unicode)”的转换表。

把这个表放到Emeditor的批量替换表里跑了一下，千多个私用字用例就只剩下百多个，再手动把剩下的这百多个做完。

已经攻下山海关，接下来就可以挥军长驱直入中原了。

我在30楼发的是原词头。
citiao.zip (803.2 KB)

这里发的是改完后的词头。
entry.zip (844.4 KB)

想自己做词典的人可以用改过的词头去替换原词头。

也可以做一个私用字的替换表。能不能用来做别的词典，就不得而知。

amob · 2024 年8 月 12 日 05:22

我看楼主校对了不少，不拿xml做一版吗

shaoshi · 2024 年8 月 12 日 05:30

已经做完了，能用，但是估计还有一些隐藏的问题还没处理。

因为是隐藏的问题，所以不知道可能浮出水面的会是什么，不知道可能是无害的海豚，还是鲨鱼？

shark

因为停下来去弄《汉语成语源流大辞典》，所以搁置了。

贴个图。

没有兴致排查了，就发出来吧。技术限制下载。

xshd汉英研习版-中秋节版

mowang · 2024 年8 月 12 日 06:14

APP

shaoshi · 2024 年8 月 12 日 06:19

这个app的数据看来比xml和pdf都新。但是我不能根据app做校记。所以对了缩印本pdf，pdf假如还是错的，就根据pdf做校记。

啊，不对。你这是哪个英汉词典？不要把水搅浑。

mowang · 2024 年8 月 12 日 07:31

外研社与柯林斯合作的《新世纪英汉汉英大词典》

sculiuchang · 2024 年8 月 12 日 22:24

研习版，可以分享一下吗。

shaoshi · 2024 年9 月 21 日 13:32

xshd汉英研习版-中秋节版

农历九月初一(公历10月3日)月光将会黯淡。

shaoshi · 2025 年4 月 15 日 10:00

15-4-2025

《新时代汉英2》
〖大鳌虾〗
[dà’áoxiā]
[名] a lobster
参见：“［lóng］龙虾”
[校记]“大鳌虾”当作“大螯虾”。

《新世纪汉英2》也错了，但文字版掉了这一条。

shaoshi · 2025 年5 月 9 日 08:01

《新时代汉英2》
〖𮬡〗
[同义词] 𮬡骨
〈动物〉Hemibarbus maculates

[校记]“𮬡骨”当作“花𮬡”，“maculates”当作“maculatus”。

我感觉《新时代汉英》的人文科词条功力深厚，但是理科词条似乎不靠谱啊。

这不，一个词条，中文英文都错了。

还好我会用到的是人文科词条。使用理科词条的人一定得谷歌谷歌，再三复核啊。

也有可能根据的是这个资料？

{鱼骨}显然应该是“𮬡”。

shaoshi · 2025 年5 月 12 日 07:27

《新时代汉英大词典》1469左

〖青帝〗
[Qīngdì]
(1) [同义词] 苍帝
Qingdi or the Black God,
[校记]东方配木、青色，树木是绿色的，“青色”当然是“绿色”。“青帝”必须译为“the Green God”，不可译为“the Black God”。黑色只能配北方。

Wikipedia
Chinese gods and immortals
Three Patrons and Five Deities
Cangdi (蒼帝, “Green Deity”); or Qīngdì (青帝, “Blue Deity” or “Bluegreen Deity”,

《维基百科》这个词条模棱两可，就是骑墙派。青帝(蒼帝)到底是“Green Deity”、“Blue Deity”或“Bluegreen Deity”？

如我在上面所言，因为东方配木，树木是绿色的，所以青帝(蒼帝)只可能是“Green Deity”.

haoshu · 2025 年5 月 16 日 10:05

用这个数据又做了一版，尽量保留原数据的xml结构，给css编写留下更大空间；词头保持精简，繁异体字和同义词没有扩充；保留了相应的一些音标。多音字的词条没有合并，所以跳转可能有些问题；多音字读音的跳转没有正确指定；私有区字还没改；带（）的多形式词没有拆分扩充。保留了191个图的链接，如果抓取的数据还有或者用什么别的方式，可以补进去。
XSDHY.mdx (16.0 MB)
私有区字改了
XSDHY1.mdx (14.0 MB)

shaoshi · 2025 年5 月 16 日 11:21

版本多了，选择更多，总是好事。

只有小白们才会为众多版本而纠结，一直追问哪个是最好的版本。哈哈！

鼓励老兄制作一个带图表的版本。乐见其成。

独行瞏瞏 · 2025 年5 月 17 日 00:33

这个没有CSS样式吗？

haoshu · 2025 年5 月 17 日 14:18

我不太会写css，所以还没写。下周找个时间试试