2023/11/05 更新 精选基础词典【图文综合版】

一些德语词典的源文件 - 资源分享 - FreeMdict Forum
娱乐之作,hua大早年发过数据,心里一直有疙瘩总是想做。今天打开数据一看,ocr的,烂得很,硬着头皮花了几个小时改了很多错误,把词头复原为可查(把星号、括号和竖线处理了),没提取词组(英语德语汉语混一起了,没标签,我不会)。
不过还是个半废品,得结合图片版看,等有时间了再做个图文综合版吧。懒得放图了,不咋地的书(因为糟糕源数据),可作为备考。
bedcdec.zip (5.8 MB)
唉,希望能有更多破解数据的人。

11 Likes

跌跌撞撞连着弄了好几天(二十小时以上吧),结合图片版算是值得一用了。图片版比较简陋,因为懒得认真搞了。校对词头要眼花了,再也不想做了:joy:
平时查慎看正文中的英文和德文,大小写混乱,看看汉语就差不多了,不过词头正确率挺高的。
打开图片要点两下页码,不知道怎么搞的,我不会修,完全不懂js,懂的大神可以帮忙改改。
各种各样的词头扩容我搞了大半天,4个德语变音字母你打普通字母也能搜。
我还发现全文都是β,并替换成了ß。全文都是全角括号、逗号、分号都换成了半角(看着舒服)。
校对图片版词头的时候顺手修了文字版很多错误,以及在快做完时发现有七百多个词和别的词混在了一起(源数据糟糕,别怪我),我搞不出来,正则很容易带来别的问题,于是就只是重定向了。比如Weltmacht下的welt­män­nisch。


提醒下,不想要图片的别下载.1.mdd就可以了。

可能有的图片切得不太好,导致有的时候页眉有一点点看不到,因为这读秀资源这页面上下左右到处移动。。。原本图像质量也还不错,我对图像的处理纯属个人喜好。

7 Likes

2023/11/05 修正1168、1169页的显示,把词典信息补上了。只需重新下载mdx。

1 Like

感谢辛苦的付出。

再次小更新

之前有提到有些词头混在别的词条里了,在英语里有的是变形,不过大多数还是另一个词了,毕竟几百个词真的没精力处理,我不可能再推翻重做。一个个手工抽出来加标签加页码至少得10个小时了,再去正则可能影响别的词条。可惜我没有在一开始发现它们吧。
于是我加的重定向词头,却忘记处理让它们更好查,刚刚手工处理了几十条,处理诸如竖线和变音字母。

目前这个词典很难求完美,一开始批量加扩展词头在早期,后来修正错误等可能又抽出来了一些词头没处理,就这样吧。

顺便补充下,本词典粗略统计英语12000词,德语16000词。

2 Likes

emm,缩略语这里页码不太好看,谁能指导下改改css?

给楼主点赞!小语种关注的人不多,愿意花时间去做词典的就更少了 :joy:

1 Like

魔鬼在细节,只有你发现 :point_up_2:

楼主制作的是2013同济版的吧,对应的德语原版是:
PONS Basiswörterbuch Deutsch als Fremdsprache 2010

PONS德语词典收词最全的是 @神农X 贴出来的这本,因为PONS在2019年已经收购了朗氏,这本可以看作是朗氏“大黄”的升级版:

1 Like

此问题经高手指导解决了,请重新下载。顺便把缩略语词头处理了一下更好查询。

PONS Großwörterbuch Deutsch als Fremdsprache (.mdx) - 德语 - FreeMdict Forum
坛子里有文字版,拿文字版词头套上去做个图片版不难。

说到制作词典,我就外行了 :slightly_smiling_face:

制作啥的无所谓,重要的是谁扫描一下 :grin:

1 Like

哦?如果是这样,楼主可以关注一下这本:
https://downloads.freemdict.com/尚未整理/共享2020.5.11/content/4_others/german/杜登德汉大词典//
:point_up_2: 这是图片版的,查询方法是按字母索引,再按每页页首单词定位查询单词出现的页数。

坛友分享的Duden Deutsches Universalwoerterbuch文字版mdx

也有坛友3年前在做 Duden德汉大词典全词条索引电脑图片版

不知道做完了没有。

哈哈,目前做词典做怕了,等有激情和时间再说。
那家伙被封号了别等他的了。
目前主要问题在:我如果真的去做了,就和E兄冲突了,E兄做了好久了不知道吗?
杜登德汉规模得这两倍,我一页页校对首尾词头也不容易啊,何必给自己找麻烦呢?

楼主说的我不知道啊。那大家就再等等,现在的图片版用熟了查起来也挺快的。

可能两倍都不止。

这本Universlwörterbuch是杜登词典里单本最大的了,我跟杜登最大的Duden - Das große Wörterbuch der deutschen Sprache in 10 Bänden 比较过,常见单词的释义没差多少,都属于德语母语级词典了。两者相比就好比单本的ODE和20卷的OED的区别。因为Universlwörterbuch有双解版,原版mdx还带发音,所以更值得一做。

就页码而言两倍啦,杜登德汉整本2843页(去掉别的正文2800左右?),这本正文就1175页。需要校对的只有每页首尾词。

1 Like

我校对词头到二百多页了,但是感觉比较费时间也费眼睛,所以没搞了,可以用原来的词头先弄个粗略的出来。

downloads.freemdict.com/尚未整理/共享2020.5.11/content/4_others/german/杜登德汉大词典//
坛里这本的词头是用 Duden Deutsches Universalwoerterbuch和Wahrig的词头合并而成的,和杜登德汉不能完全对上

1 Like

原来如此,受教了。所以说杜登德汉的词头就是 Duden Deutsches Universalwoerterbuch吗?为什么要合并Wahrig?

估计是为了让词条多一点