公共法语学习词典

u=4161995677,2429079871&fm=224&app=112&f=GIF
资源很清晰,也是电子版本打印的,希望 wynick27大侠也给文本化一下,词条不多,5000多,是本阅读型词典。

5 个赞

最后放上pdf版本,希望下载的人不要用于盈利。
公共法语学习词典tif.pdf (8.8 MB)

4 个赞

这种印前pdf都哪里来的?出版社和印刷厂内部人员?有点厉害,没找到有这词典的电子书平台。

这个只用夸克处理还是比较容易的:

公共法语学习词典.docx (1.3 MB)

文本转换,根据字号标了词头:
公共法语学习词典_quark.txt (1.1 MB)

不过运行大模型的话就比较慢,另外发现这个其实编的不仔细,缺少69和316页,还是程序查出来的。

1 个赞

方正 弄来的,用的破解的软件下载的,只能打印,不能转换。可能高手可以搞搞,我等等去找找方法。

缺页吗?等有机会找找看看原始的数据

方正书版的数据更方便转html的,商务都直接拿方正书版源文件做APP电子数据的,不会再去拿pdf转。

可能我不会转,我去看看想办法把数据搞过来

:clap:你真挺厉害,方正原始文件都能弄到。

不是缺页,应该是页码标错了。

就是网上的方法也没什么特别的呀。方正的破解软件,不过很久以前了,现在软件可能不好用了。

:thinking:没听说过,我不是那个时代的人。方正哪里能直接下到印前电子书,方便透露相关细节吗?
是阿帕比的中华数字书苑?从来没机会进去看过。是不是二十年前下的cebx,现在拿阅读器破解插件打印转pdf?那看来不是方正书版源文件。

对,好像就是这个方法,但不是20多年前,也就4—5年前吧

我找到的帖子都是二十年前的了,阿帕比我都感觉不是这个时代的东西了。

我查了下这个格式是类似xml的,应该是可以直接提取数据的。

apabi的ceb和cebx格式是加密的,不用想了,而且是私有格式,也没办法变成pdf(就算可以,也根本没人发出来工具)。
好像能找到

方正的阿帕比电子书质量比较高,印前文件转的,或者OCR成的电子文本,当初和超星齐名,但图书数量少,多是垃圾书,没什么人有太大兴趣研究它,后来就逐渐没落无名了。

刚刚上这个平台看了一眼,新书不多,语言文字分类而言,相当惨淡。

好些老书超星上面也有,资源估计也有转卖(只是一部分,超星这些年也下架了很多老书了),上面的工具书则是有转卖到知网工具书平台,原来早期工具书都是Apabi做的。

https://blog.csdn.net/xuyun0565/article/details/141085798

一机一码的,证书校验的,你没访问权限,就算知道解密方法也无用,再者他也没公布解密方法。

不过我是搞错了,CEB应该不是XML是PDF的封装,CEBX是基于XML吧。楼主那么久以前下载来的应该是CEB格式的,楼主翻到了源文件可以试试看。

CEB格式解析和解密方法,CEBX没看到~~~
apabi数字版权保护 - CPC中文印刷社区
原创 c2p命令行版以及源代码 - CPC中文印刷社区

c2pFree20151105.rar (19.3 MB)