
资源很清晰,也是电子版本打印的,希望 wynick27大侠也给文本化一下,词条不多,5000多,是本阅读型词典。
最后放上pdf版本,希望下载的人不要用于盈利。
公共法语学习词典tif.pdf (8.8 MB)
这种印前pdf都哪里来的?出版社和印刷厂内部人员?有点厉害,没找到有这词典的电子书平台。
这个只用夸克处理还是比较容易的:
公共法语学习词典.docx (1.3 MB)
文本转换,根据字号标了词头:
公共法语学习词典_quark.txt (1.1 MB)
不过运行大模型的话就比较慢,另外发现这个其实编的不仔细,缺少69和316页,还是程序查出来的。
方正 弄来的,用的破解的软件下载的,只能打印,不能转换。可能高手可以搞搞,我等等去找找方法。
缺页吗?等有机会找找看看原始的数据
方正书版的数据更方便转html的,商务都直接拿方正书版源文件做APP电子数据的,不会再去拿pdf转。
可能我不会转,我去看看想办法把数据搞过来
你真挺厉害,方正原始文件都能弄到。
不是缺页,应该是页码标错了。
就是网上的方法也没什么特别的呀。方正的破解软件,不过很久以前了,现在软件可能不好用了。
没听说过,我不是那个时代的人。方正哪里能直接下到印前电子书,方便透露相关细节吗?
是阿帕比的中华数字书苑?从来没机会进去看过。是不是二十年前下的cebx,现在拿阅读器破解插件打印转pdf?那看来不是方正书版源文件。
对,好像就是这个方法,但不是20多年前,也就4—5年前吧
我找到的帖子都是二十年前的了,阿帕比我都感觉不是这个时代的东西了。
我查了下这个格式是类似xml的,应该是可以直接提取数据的。
apabi的ceb和cebx格式是加密的,不用想了,而且是私有格式,也没办法变成pdf(就算可以,也根本没人发出来工具)。
好像能找到
方正的阿帕比电子书质量比较高,印前文件转的,或者OCR成的电子文本,当初和超星齐名,但图书数量少,多是垃圾书,没什么人有太大兴趣研究它,后来就逐渐没落无名了。
刚刚上这个平台看了一眼,新书不多,语言文字分类而言,相当惨淡。
好些老书超星上面也有,资源估计也有转卖(只是一部分,超星这些年也下架了很多老书了),上面的工具书则是有转卖到知网工具书平台,原来早期工具书都是Apabi做的。
一机一码的,证书校验的,你没访问权限,就算知道解密方法也无用,再者他也没公布解密方法。
不过我是搞错了,CEB应该不是XML是PDF的封装,CEBX是基于XML吧。楼主那么久以前下载来的应该是CEB格式的,楼主翻到了源文件可以试试看。
CEB格式解析和解密方法,CEBX没看到~~~
apabi数字版权保护 - CPC中文印刷社区
原创 c2p命令行版以及源代码 - CPC中文印刷社区
c2pFree20151105.rar (19.3 MB)

