好的。谢谢。我下来比较一下看看。
楼主确定好版本了吗?
我最后选了楼上 hipda 发的那个(选为解决方案了):关于21世纪大英汉词典的版本 另外求隔壁站 henices 的版 - #4,来自 hipda
链接失效了,谁能补一下吗?
21世纪大英汉词典By哈姆and校对九色鹿(词条数483723完美版).zip (32.1 MB)
这个版本数据是最好的。哪位能调整一下CSS界面就好了。
这个版本查询stingray字符集无法正常显示,看能否改改
Here you go:
21.7z (32.1 MB)
Revised log:
Batoidea魟
Dasayatidae魟
Gymnuridae鲽
manta鳐
stingray魟
whipray魟
2020.05.28
谢谢你,我的朋友
能否麻烦您再改改,谢谢了!
不知你是怎么改的,感觉里面的字符集挺奇怪的,里面说是UTF-16吧,但查到的繁体字与pdf中的繁体字不是一个,如果一个一个对应去改,那真的需要时间啊,发现里面以&#x开头的还是很多的。
不会用正则,纯手工替换,拿别的版本来对比,或者搜一下bing,这样。。。
多是生僻词,对我等只需简单懂英语即可的,目前的也够用了,我跟进不来
这些不正确的转义符不好处理,不计重复的,有两三百个词吧,只能手工修改了。提取的文本放这里,给有迫切需求的人帮忙修改吧:
转义序列(escape sequence).7z (77.9 KB)
也放一个简易的修改教程吧,改好了也上传到这里,一定会有人帮忙合并到词典里去的:
好的,谢谢啦!
其实这里的难点是里面有一部分字是介于简繁之间的,比如魟是繁体字,但在字典中却用的是鱼的简体偏旁,类似这样的字我搞不懂哪个字体或什么输入法能显示出来,如果直接使用UTF-16,则转化出来的全是错误的(与PDF不一样)。似乎这类字以*以上的居多。
可以参考众多的网络词典,譬如我觉得Bing词典就挺好的
同求henices的版布。
词条【-faced】henices有优化过
感谢排版。比原来的界面美观多了。