2022-02-22日校正版
校改若干零散错误
2022-01-06日校正版
1)在MDict中再次通读词典,修复数百处细节错误;
2)中文例句翻译中的半角字符修正为全角;
3)删除中英文例句中赘余的引号
2022-01-02日改正版
1)修复30余处词组错位等;
2)释义内不匹配的半角括号改为全角;
3)改正mdictfan提出的单词粘连问题
2021-12-27日校改版
1)快速通读整个词典,找到并更改300处左右的错误;
2)usage标签改为idiom;
3)补充缺失的phrase、idiom标签;
4)添加 guide 标签;
5)删除重复多余的“headword”标签;
6)借鉴supplement提供的css,版面略作调整
2021-12-15日初步修正版
1)替换音标,不再需要金山音标字体依赖;
2)更改黑方块(■)标志为序数形式;
3)零散修改部分错误;
4)规范class命名,略微调整CSS;
5)更改词典名称为《21世纪英汉词典》
原始MDX词典信息
数据来自:金山词霸2007 PWDECMEC.DIC,用KSDrip.exe(工具作者dwing)提取。
制作者:O 版本:v1.1,2013年10月11日 19:46:41
这个词典原来叫《当代英汉词典》,Index of /100G_Super_Big_Collection/英语/普通词典/[英-汉]/当代英汉词典/ 可下载,版权信息云:“郑建德,梁德润主编. 当代英汉词典. 北京市:旅游教育出版社, 1996.” 导致了我一段时间忽视了它,后来研究了一下,发现它很可能的底本是外文出版社的《21世纪英汉词典》。pdawiki上有个帖子( https://www.pdawiki.com/forum/thread-11254-1-1.html )说其来自金山词霸,底本是《当代英汉词典》,依据是当当上的介绍文字:“他们主编的《当代英汉词典》(旅游教育出版社出版)的电子修订版已收入金山公司的电子词典《金山词霸III)(北大出版社出版)。”( http://product.dangdang.com/349057.html
)这句话里的“电子修订版”给出了线索,查梁德润、郑建德主编的词典还有《21世纪英汉词典》,是外文出版社1999年05月出版的,而我恰好有这本词典,根据其在序言里提到的新收录词汇antivirus等能在mdx电子版中查得,又随机对照了若干页手上的纸版与mdx电子版,我可以基本确认此电子版文件的真正底本是《21世纪英汉词典》,而不是《当代英汉词典》。不过网上为什么故意说成是《当代英汉词典》,我猜可能是版权问题,《当代英汉词典》年份比较老了,且出版社牌子没外文出版社硬,容易取得电子版授权。
我个人比较喜欢《21世纪英汉词典》,是因为它收词中等程度,释义简明扼要,例句除必要外相对很少,是少量比较适合读或者背的词典,把这本词典里的单词弄通记熟,基本可以达到英语母语人士本科毕业的程度(据说是2-3万词汇量,而本词典有4万词头——当然也不能这么简单比,英语母语人士的词汇量测试没太大准头,这个词典一些衍生词也单独列entry,不过也大致差不远了)。
闲话少叙,找到这个MDX文件之后,发现部分问题,比如依赖金山音标字体,独立释义用黑方块“■”标示,而不是原始纸本或者习惯用的1. 2. 3.序号,html文件当中的类class用汉语拼音命名等,也有其他零散错误,能发现的尽量做了修正。
不过这个改动过程很多是依赖程序批量处理的,很可能不小心引入了新的错误,我把它发到论坛,一则与同好共享,二则希望能借助众人之力,继续修正谬误使之更为完善。
原始版:
修正版:
21世纪英汉词典.mdx (3.1 MB)
21CENTEC.css (1.6 KB)
推荐 @supplement 提供的更美观的css: https://forum.freemdict.com/uploads/short-url/r4rGKRKd0CgAOOo2dq3Vw5k18v8.css
39 个赞
收词量在4万左右,可以与《21世纪英汉词典》相侔的还有外研社的《现代英汉词典》、《牛津高阶英汉双解词典》等,《现代英汉词典》的语法标注、例句稍嫌繁多,不是那么清爽干净,而牛津高阶、朗文当代这些加上英文解释、各种中英文例句肯定是没法通读了,而且,牛津高阶的收词量实际上是大于某些版本显示的4万 entry的,很多衍生词跟在主词条后面,加上各种词组,不一而足。
如果能把《21世纪英汉词典》攻下,可以继续考虑《牛津高阶》,它里面收录的词条通常是比较经典的、英语母语人士阅读很可能会碰到的,让自己更上层楼。再往上呢,我认为是不必用读词典这种方法了,阅读中遇到了查一下即可,它对你是生词,对native speaker也极可能是生词。
我曾经把ODE(即《新牛津英汉双解大词典》)的词条用牛津高阶过滤了一下,看删了高阶的词汇后剩下些什么英文单词,结果比较有趣,大量词汇一般人连中文释义都未必懂,更不用说英文词条了,下面给出以x开头的词汇的例证。
Xanadu /ˈzænəˌdu:/ (pl. Xanadus) 华厦,行宫;诗情画意的地方(用来表述对几乎无法达到的奢华或美丽之地的印象)
Xanax /ˈzænæks/ noun [商标] 同 alprazolam
xanthene /ˈzænθi:n/ noun 1. [化] 呫吨,(夹)氧杂蒽,三环二苯并吡喃;呫吨衍生物 2. 化学分子式:C13H10O
xanthine /ˈzænθi:n/ noun 1. [生化] 黄嘌呤 2. 嘌呤衍生物;化学分子式:C5H4N4O2 ➜ 黄嘌呤衍生物(如咖啡因、可可碱、茶碱等)
Xanthippe /zænˈθipi , -ˈtipi/ (亦作 Xantippe) 赞蒂皮(公元前5世纪哲学家苏格拉底之妻,据说她粗暴对待丈夫的行为使她悍妇的形象家喻户晓)
xanthoma /zænˈθəumə/ (pl. xanthomas 或 xanthomata -mətə) [医] 黄瘤
xanthophyll /ˈzænθəfil/ noun [生化] 叶黄素,胡萝卜醇
Xe for symbol (化学元素)氙
xebec /ˈzi:bek/ (亦作 zebec) noun [史] (航行于地中海的)三桅小帆船
Xenakis /zɛˈnɑ:kɪs/ 泽纳基斯,扬尼斯(生于1922,法国作曲家和建筑师,希腊后裔,因在音乐中运用电子乐和偶然音乐而著称)
Xenarthra /zɛˈnɑ:θrə/ plural noun [动] 贫齿目。(亦称 Edentata) 〈派生〉 xenarthran noun & adjective
Xenical /ˈzɛnɪk(ə)l/ noun [商标] 让你酷(一种合成减肥药)
xeno- /ˈzenəu/ for combining 1. 表示“外国人” ➜ 表示“异”,“外来的”,“陌生的”
xenobiotic /ˌzenəubaiˈɔtik/ adjective 异型生物质的 noun 异型生物质
xenocryst /ˈzenəˌkrist/ noun [地质] 异晶,捕获晶 〈派生〉 xenocrystic adjective
xenogamy /zi:ˈnɔɡəmi/ noun [植] 异株异花受精。 〈派生〉 xenogamous adjective
xenogeneic /ˌzenəudʒiˈni:ik/ adjective [生] 异种的;异基因的
xenograft /ˈzenəɡrɑ:ft/ noun 异种移植物
xenolith /ˈzenəliθ/ noun [地质] 捕虏体,捕虏岩(指火成岩中与其无成因关系的包体) 〈派生〉 xenolithic adjective
xenology /ziˈnɔlədʒi/ noun (主科幻)外星生物学;外星文化学;外星研究 〈派生〉 xenologist noun
Xenophanes /ziˈnɔfəni:z/ 色诺芬尼(约公元前570–约前480,古希腊哲学家。作为埃利亚学派成员,他为一种泛神论辩护并批判对拟人神的信仰)
Xenophon /ˈzenəfən/ 色诺芬(约公元前435–约前354,古希腊历史学家、作家和军事领导人;自公元前401年起,和小居鲁士一道与阿塔泽克西兹二世作战,在小居鲁士被杀后率一万希腊雇佣军撤退约1,500公里,即900英里;此次战争与撤退均被载入《远征记》中,其他代表著作包括《希腊史》)
Xenopus /ˈzɛnəpəs/ noun 1. 爪蟾属 2. 拉丁名Xenopus laevis,负子蟾科
xenotime /ˈzenətaim/ noun 1. [矿] 磷钇矿 2. 成分: 由天然钇磷酸盐组成
xeric /ˈzi:rik/ adjective [生态] (环境,栖息地)缺湿的,干旱的。
xeriscape /ˈzerəskeip/(chiefly uS)ə主美] noun 1. 干旱景色 ➜ 旱园,旱景 verb 1. 使(某地)呈现干旱景色
xero- /ˈziərəu/ for combining 表示“干燥”
xeroderma /ˌziərəuˈdə:mə/ noun 干皮病,皮肤干燥病
xerography /ziˈrɔɡrəfi/ noun 静电印刷术 〈派生〉 xerographic adjective xerographically adverb
xerophilous /ziəˈrɔfiləs/ adjective [植,动] (动植物)适旱的,喜旱的;旱栖的 〈派生〉 xerophile noun
xerophthalmia /ˌziərɔfˈθælmiə/ noun [医] (尤指因缺少维生素A引起的)眼干燥,干眼病
xerophyte /ˈzɪərəˌfaɪt/ noun [植] 旱生植物 〈派生〉 xerophytic adjective
Xerox /ˈziərɔks/ noun 1. [商标] 施乐复印(法),静电复印(法) ➜ 静电复印件 ➜ (施乐)静电复印机 verb 1. 施乐复印,静电复印(文件)
x-height /ˈeksˌhaɪt/ noun x高度(小写体x的高度)
Xhosa /ˈkɔ:sə/ [复同单,或 Xhosas] 1. 科萨人(历来居住在东开普省的南非人,他们构成继祖鲁人之后的第二大种族群) 2. (科萨人使用的)班图语(与祖鲁语有关连,有约600万使用者) adjective 1. (与)科萨人(有关)的;(与)科萨人使用的班图语(有关)的
Xiamen /ˈʃjɑ:ˈmen/ [亦作Hsia-men] 厦门(中国东南部福建省港口,1990年人口639,400)。(亦称 Amoy)
Xian /ʃi:ˈæn/ (亦作 Hsian 或 Sian) 西安(中国中部工业城市,陕西省省会,1990年人口2,710,000;该市自公元前11世纪起就有居民居住,汉朝、隋朝和唐朝曾定都于此;。 原称 Changan, Siking)
Xiang /ʃi:ˈæŋ/ (亦作 Hsiang) noun 湘言(汉语方言,约有3,600万使用者,他们主要居住在湖南省)
Xingtai /ʃɪŋˈtaɪ/ 邢台(中国东北部城市,位于河北省石家庄南面,1986年人口1,167,000)
Xingú /ʃɪŋˈgu:/ 兴古河(南美洲河流,起源于巴西西部的马托格罗索,全长1,979公里,即1,230英里,流向一般向北,汇入亚马孙河三角洲)
Xining /ˈʃi:ˈniŋ/ (亦作 Hsining 或 Sining) 西宁(中国中北部城市,青海省省会,1990年人口697,700)
Xinjiang /ˈʃinˈdʒjɑ:ŋ/ (亦作 Sinkiang) 新疆(中国西北部自治区,与蒙古和哈萨克斯坦接壤,1990年人口 15,156,000;首府乌鲁木齐)
xiphisternum /ˌzifiˈstə:nəm/ noun [剖] 剑突(胸骨)
X-irradiation noun 用X射线辐照
Xizang /ˈʃi:ˈzɑ:ŋ/ [汉] 同 Tibet
Xmas /ˈkrɪsməs , ˈeksməs/ noun [非正式] 同 Christmas
xoanon /ˈzəuənɔn/ (pl. xoana -nə) (古希腊)木雕神像
X-rated /ˈeksˌreitid/ adjective 1. 色情的,淫秽的;下流的,猥亵的 ➜ [史] (电影)X级的,青少年禁看的,只供成年人看的(见 x)。 (见 x)
X-ray /ˈeksˌrei/ noun 1. X光,X射线,伦琴射线 ➜ [非正式] 像X光一样 2. X光照片 ➜ X光检查 3. (无线电通讯中使用的)X密码 verb 1. 用X光拍片(或检查)
xu /su:/ [复同单] 分(越南货币单位,100分等于1盾)
Xuzhou /ʃu:ˈdʒəʊ/ (亦作 Hsu-chou, Suchow) 徐州(中国东部江苏省城市,1990年估计人口910,000;。 原称Tongshan[1912–1945] )
xylene /ˈzaili:n/ noun 1. [化] 二甲苯;二甲苯和乙苯的混合溶剂 2. 又名: dimethylbenzene,化学分子式:C6H4(CH3)2;有3种同分异构体
xylitol /ˈzailəˌtɔl/ noun 1. [化] 木糖醇 2. 化学分子式:CH2OH(CHOH)3CH2OH
xylo- /ˈzailəu/ for combining 表示“木”,“木质”
xylography /zaiˈlɔɡrəfi/ noun [罕] (尤指采用相对原始的技术而制成的)木刻;木刻版;(木)版画 〈派生〉 xylographic adjective
xylophagous /zaiˈlɔfəɡəs/ adjective [动] (尤指昆虫幼虫或软体动物)食木的,蚀木的,蛀木的
xylose /ˈzailəus/ noun [化] 木糖,吡喃木糖
xystus /ˈzistəs/ (pl. xysti -tʌɪ) 1. (古希腊供运动员运动用的)门廊 2. (古罗马的)花园小径(或阶地)
5 个赞
bwjhr
2021 年12 月 15 日 00:38
3
总算把这个词典的出身搞明白了.使用词典时经常稀里糊涂的,特别需要大神这样的做些细致分析.
mixivivo:
21世纪英汉词典
感谢更新。
这本词典释义精炼,适合阅读。
对比了一下纸质版,如anticipate词条,电子版做了增删。
1 个赞
谢谢支持,我提供几张刚拍的书影。
封面
序言
内页
单词下的红线是我20年前画上去的,这本词典现在应该不容易买到了。
6 个赞
老兄,可有此詞典的 pdf , 在下想搞一個粗配定位
抱歉,我没有PDF文档,不过你可以向 salome 打听一下,他好像对下载超星电子书比较有办法。以前在读书园地(readfree)玩的时候,还是有途径弄图像版电子书,现在readfree也关站了,我本人也很久失去了兴趣研究这些。
1 个赞
用于“读”的词典,其实pdf比mdx格式更合适(当然也可以一个个词条在mdict中翻阅),待这个词典做得比较完善的时候,我会导出一个纯TXT文档贴在github,怎么折腾它都可以。我做这个文档还有一个想法,就是用它作为一个中型英汉词典数据库的基础之一,其文本相对可靠,释义精炼,像skywind搞的ecdict( GitHub - skywind3000/ECDICT: Free English to Chinese Dictionary Database ),数据庞大芜杂,泥沙俱下,其实经常是没法用的,用ecdict给一个高中词汇表自动生成解释,一个set 30-40个释义,胡乱堆在一起,还常常夹杂着人名、重复的[医学]、[化学]解释等,让人怎么取舍?
3 个赞
适合读的英汉词典,实际上还有一些,比如《牛津中阶英汉双解词典》,收录20000词头,文档格式美观,释义也比较简洁。我把原始的mdx按字母表分解成了26个html文件,在浏览器里划拉着翻阅,是很方便的,在此贴一下。——不要打开那个十几M的合并html文档,渲染负担可能会导致浏览器崩溃。
牛津中阶英汉双解词典.zip (7.6 MB)
3 个赞
有你真好
2021 年12 月 15 日 14:18
12
感谢大侠分享,请教一下如何将MDX转成您这种带格式的网页呢?
把mdx转为带格式的网页是很简单的,因为mdx本质上就是压缩了的网页。
用readmdict( Bitbucket )把mdx文件解开,生成一个txt文件,这个txt文件实际上是html网页,把后缀改为html。
用文本编辑器(ms code,note pad++,emeditor等)打开此html文件,用正则搜索把索引词头删除。词头是"aback"这部分,在</>下面。
</>
aback
<link href="PWDECMEC.css" rel="stylesheet" type="text/css">
——可以考虑这样的正则表达式 </>\n.*\n<link href= 替换为 </>\n<br>\n<link href=
替换完成后,保存,就是一个跟你在词典文件里看到的格式一样的html文档。注意如果有css文件,要把它放在跟html文档同样的文件夹里,因为html外部引用格式时要用到此css文件,找不到,就不会渲染格式。
生成的html文件可能会很大,几十甚至几百兆,浏览器直接打开cpu会狂转,甚至浏览器崩溃,可以把它分割成不同部分复制出来另存档为小一些的html(平均1-2m以下大小可能比较合适)。
跟mdx一样,可以调整相应的css使html呈现自己喜欢的样式设计。具体怎么弄css,是另一个话题了,不过也不是太复杂,简单的稍微学一下就会。
6 个赞
如果你电脑基础不是很好,我说的还是不容易办到,使用readmdict要装python,正则也是个烧脑的东西,不过导出mdx有“GetDict”这种现成的exe软件,可以搜一下。正则也不要怕,不懂的话说明自己的需求在论坛问。在这里要正则删除“索引词头”,是因为索引词头没有html标签,无法隐藏,一定会在浏览器中渲染出来,这就会和词条正文中也有的词头(<hw>标签之类)重复,影响观瞻。
fix
brush
cash
catch
bowl
bowl over前要加div class=“phrase”
button
button up前要加div class=“phrase”
3 个赞
谢谢你指出的诸处问题,提供的CSS更是令本人的寒碜试作蓬荜生辉,焕然一新,本来我想糊弄一下就算了,没想到会得到如此抬爱,真是受宠若惊,看来我得努力认真把这个mdx做得更完善一些。
4 个赞
@ fruition 原来我粗略找了一下,以为自己没有此词典的pdf文件,后来细想,如果真的是我留意过的词典,没道理我不想方设法将其下载到硬盘里。在电脑上认真翻检,果然发现了《21世纪英汉词典》的PDG文件,于是把它转成为OCR过的双层PDF文件,现将其上传于此。如果你需要原始的PDG文件,高质量从头制作,可以给我发私信。
21世纪英汉词典(OCRed).part1.rar (20 MB)
21世纪英汉词典(OCRed).part2.rar (20 MB)
21世纪英汉词典(OCRed).part3.rar (20 MB)
21世纪英汉词典(OCRed).part4.rar (836.3 KB)
4 个赞
此处的pdf制作比较粗糙,用老马的Pdg2Pic直接从pdg生成pdf,再用acrobat pro自动OCR识别。以前搞这些,花样可多了,“ComicEnhancerPro”调整对比度,去噪点,“Recogniform Image Processor”使页面居中,“锐尔文档扫描影像处理软件”纠斜、删除黑边,等等,现在没这么多耐心了,反正它不属于我自己要从头读到尾的PDF。
1 个赞