《精选双解西班牙语学习词典》 OCR文本

最近在同时学日语和西班牙语,但是和日语比起来西班牙语资料非常少。今年刚出了一本学习词典,不过太新了没有扫描版,价格也比较贵。 而双解词典目前只有这一本,是基于Diccionario Lengua Espanola (Edebé Primaria) 这本词典的,属于初级词典。

我把这本词典用gemini识别了下,做了简单修订,文本内容没有校对,不过错误不是很多,等有时间了会结构化,也会做mdx

精选双解西班牙语学习词典_gemini.txt (3.8 MB)

另外补充夸克识别的版本:
精选双解西班牙语学习词典.docx (8.5 MB)

原版pdf的百度盘链接在这里(也可在anna’s archive下载):
精选双解西班牙语学习词典.pdf
链接: https://pan.baidu.com/s/1E4384J2YzwT1oElX28axww?pwd=1234 提取码: 1234

2 个赞

多谢扫描分享。下来看看。词典序号标签有点奇怪,单个词义放了①符号,似乎没有必要。

这个不是我扫描的,是直接下载的。序号的话原文就是这样的,我只加了词头标记和词组标记,方便后续处理。

doc文件打不开,不知道是怎么原因。

精选双解西班牙语学习词典_quark.txt (3.9 MB)

我测试过可以打开的,我也把这个docx转换成了文本文件,但这样图片会丢失。

我重新下,能打开了,另存为 txt 浏览,似乎效果不好。对比起来 gemini 这个不错。

有本《现代意大利语词典》(意汉双解版)也可以搞一搞,但我开的战线不少,没那么多时间和精力了。

这个确实可以抽空搞一下,另外还有一本《新西汉词典》我也准备搞一下。

这词典已经文本化了,质量好像还可以。

孙义桢2010版?

对,是新版,上面提供的文本是82年的版本,感觉比较老了。 另外最新的那本《西汉学习词典》也是孙义桢编的,都92岁了还在编词典挺令人敬佩的。

简单统计一下,这本双语词典词条 12700 多个,不到一万三,有点少,查到率低。

这个应该是小学生用的,和牛津初阶, 例解学習国語辞典之类的差不多。不过我西语才开始学,感觉用这个挺合适的。

这些人编书,起名字也是胡来一通,两家不同的出版社,都叫《新西汉词典》,而且我比较讨厌中文起名里面加“新”字,有种墙新树小画不古的感觉,同时缺乏历史意识,到底打算存在、标新立异多少年,20、30年后,还叫新吗?《世说新语》、《新唐书》真是够新的。

新时代西汉删改的,估计都是出版社操作,孙老不怎么参与再编辑吧。有了新时代西汉mdx,不需要这个了。

上海译文的《新西汉词典》收词据称6万余条,属于中型词典,还是可以做一下的,形成不同层次的高低搭配。不过目前看到的图像底本不是很清晰,跟《拉鲁斯法汉双解词典》通行版差不多,OCR后文字校正的工作量应该也近似。

一般是有前身或者致敬老前辈(X汉词典)才会这么取,还有别的例子的。

宝石西汉词典,皇冠西汉词典,学而西汉词典,(译文)西汉词典,沪江西汉词典,小米西汉词典,21世纪西汉词典,孙义桢西汉词典,我认为都比“新西汉词典”这个容易混淆且含糊不清的名字强。

还真是政治献礼,X汉词典和新时代X汉大词典都是21世纪初成系列的国家出版计划。还是很感谢有政治参与的,现在哪有人编大的外语词典。

未必很需要,用得上大词典的,一般也能直接读原文了,现在又有了Google和ai的加持,更方便快捷。