所以使用这种加密字体的词典,是没有通用的替换表的?每部词典都可以出现新的变化?
每部词典得重新人工替换?
所以使用这种加密字体的词典,是没有通用的替换表的?每部词典都可以出现新的变化?
每部词典得重新人工替换?
不知道,但是这种静态字体加密的方式有点过时了,随时可能会升级,现在都是动态字体加密,破解方需要自己训练识别,而且不能保证 100% 还原。珍惜现在的美好时光吧。。
这种就是没加密。
xml 版的辞源也没加密
<YiXiang> 竟,乃。 <ShuZheng><Q>戰國策</Q><Q>齊</Q>一:“<Z>靖郭君</Z>之於寡人,一至此乎!”</ShuZheng></YiXiang>
<YiXiang> 助詞。用以加強語氣。 <ShuZheng><Q>管子</Q><Q>霸形</Q>:“今<Z>楚王</Z>之善寡人一甚矣。”</ShuZheng><ShuZheng><Q>戰國策</Q><Q>燕</Q>一:“此一何慶弔相隨之速也。”</ShuZheng></YiXiang>
<YiXiang> 樂譜記音符號之一。詳“<LianJie link="82114696-J4X6G3">管色譜</LianJie>”。</YiXiang>
主要是清理私有字的过程探索下能不能自动化,以及xml有缺数据的,用网页版可以补补,目前加密的就看到一个网页版辞源。
我试了一下这个方法。把私用字贴到检索框里,就会显示正确的字。
假如再检索,会得到《现汉》的词条。
但是,不管是检索框里的字,还是网页《现汉》显示出来的字,都仍然是私用字。
假如复制回来,还是私用字。
仍然得自己找Unicode编码。
唯一的好处是不必猜是什么字。
已经有M.C的xh7文本了。这个字xh7假如有,可以再查xh7的mdx,看Unicode是什么。mdx用的是Unicode。
但是我自己有一个Access的汉字资料库,已经相当完备了,能用两分法找Unicode。所以就不用这个方法了。
其他人可以考虑用叶典。叶典网站慢得很,但坛里有佛爷做的叶典mdx。
假如是正文里的私用字,可以看词头是什么,查K大的mdx。K大的mdx已经转换成了Unicode。
写了上面的帖子后,因为提到M.C的《现汉7》,忽然灵光乍现,想到了解决问题的办法。
<ci>〖锕〗</ci>
<yiti>(錒)</yiti>
《新时代》有私用字的词头多数是类推简化字,但是所附上的繁体字多数是Unicode。
由此可以做出一个繁体字和类推简化字(私用字)的表。
M.C的《现汉7》是Unicode词头,有许多类推简化字,另外做了繁体字的跳转,跳到类推简化字的词头。
㑳
@@@LINK=㑇
这些跳转可以做成另一个繁体字和类推简化字(Unicode)的表。
把两个表在数据库里联系起来,在繁体字上做链接,就可以得出一个“类推简化字(私用字)”到“类推简化字(Unicode)”的转换表。
把这个表放到Emeditor的批量替换表里跑了一下,千多个私用字用例就只剩下百多个,再手动把剩下的这百多个做完。
已经攻下山海关,接下来就可以挥军长驱直入中原了。
我在30楼发的是原词头。
citiao.zip (803.2 KB)
这里发的是改完后的词头。
entry.zip (844.4 KB)
想自己做词典的人可以用改过的词头去替换原词头。
也可以做一个私用字的替换表。能不能用来做别的词典,就不得而知。
我看楼主校对了不少,不拿xml做一版吗
已经做完了,能用,但是估计还有一些隐藏的问题还没处理。
因为是隐藏的问题,所以不知道可能浮出水面的会是什么,不知道可能是无害的海豚,还是鲨鱼?
因为停下来去弄《汉语成语源流大辞典》,所以搁置了。
贴个图。
没有兴致排查了,就发出来吧。技术限制下载。
这个app的数据看来比xml和pdf都新。但是我不能根据app做校记。所以对了缩印本pdf,pdf假如还是错的,就根据pdf做校记。
啊,不对。你这是哪个英汉词典?不要把水搅浑。
研习版,可以分享一下吗。
农历九月初一(公历10月3日)月光将会黯淡。
15-4-2025
《新时代汉英2》
〖大鳌虾〗
[dà’áoxiā]
[名] a lobster
参见:“[lóng]龙虾”
[校记]“大鳌虾”当作“大螯虾”。
《新世纪汉英2》也错了,但文字版掉了这一条。
《新时代汉英2》
〖𮬡〗
[同义词] 𮬡骨
〈动物〉Hemibarbus maculates
[校记]“𮬡骨”当作“花𮬡”,“maculates”当作“maculatus”。
我感觉《新时代汉英》的人文科词条功力深厚,但是理科词条似乎不靠谱啊。
这不,一个词条,中文英文都错了。
还好我会用到的是人文科词条。使用理科词条的人一定得谷歌谷歌,再三复核啊。
也有可能根据的是这个资料?
{鱼骨}显然应该是“𮬡”。
《新时代汉英大词典》1469左
〖青帝〗
[Qīngdì]
(1) [同义词] 苍帝
Qingdi or the Black God,
[校记]东方配木、青色,树木是绿色的,“青色”当然是“绿色”。“青帝”必须译为“the Green God”,不可译为“the Black God”。黑色只能配北方。
Wikipedia
Chinese gods and immortals
Three Patrons and Five Deities
Cangdi (蒼帝, “Green Deity”); or Qīngdì (青帝, “Blue Deity” or “Bluegreen Deity”,
《维基百科》这个词条模棱两可,就是骑墙派。青帝(蒼帝)到底是“Green Deity”、“Blue Deity”或“Bluegreen Deity”?
如我在上面所言,因为东方配木,树木是绿色的,所以青帝(蒼帝)只可能是“Green Deity”.
用这个数据又做了一版,尽量保留原数据的xml结构,给css编写留下更大空间;词头保持精简,繁异体字和同义词没有扩充;保留了相应的一些音标。多音字的词条没有合并,所以跳转可能有些问题;多音字读音的跳转没有正确指定;私有区字还没改;带()的多形式词没有拆分扩充。保留了191个图的链接,如果抓取的数据还有或者用什么别的方式,可以补进去。
XSDHY.mdx (16.0 MB)
版本多了,选择更多,总是好事。
只有小白们才会为众多版本而纠结,一直追问哪个是最好的版本。哈哈!
鼓励老兄制作一个带图表的版本。乐见其成。
这个没有CSS样式吗?
我不太会写css,所以还没写。下周找个时间试试