如果有一本扫描版电子书无书签要制作书签,需要找到每个章节和页码的对应关系,除了自己手工输入的笨办法,还有两种搜索方法。第一种是去出版社网站或者卖书的网站如当当京东搜索到该书的介绍,一般都有章节目录和页码信息的;另一种方法就是通过一个叫“晴天软件”的书签获取软件,输入书籍的超星的SS号就可获得。
获得了每个章节的页码之后,便可以用老马的PdgCntEditor软件给pdf添加书签了。
现在的问题是:如果我有成千上万本pdf需要制作书签怎么办?难道我要一本本手工去制作?多么浩大的工程!有没有办法自己编写程序全自动去做这件事?那个晴天软件是如何通过SS号去超星网站查找书签的?可以通过反编译看源代码吗?或者通过什么软件监视电脑与互联网的通信通过抓包来分析?具体怎么做呢?假设这第一步获得每个章节的页码可由程序自动完成,第二步就不难了,也许没办法用自己的程序来调用PdgCntEditor软件,但可以参考PDF的规范或者编程语言自身的API对PDF加入书签。
PYTHON/C++/C#/JAVA有什么PDF的API可调用吗?
我知道PDF 补丁丁 PDF补丁丁 - 博客园 这里开放了源码,可能对PDF处理有一些参考价值。但重点在第一步如何用软件去超星网站全自动批量获取书签。
附:何为超星电子书SS号?请注册登录http://www.ucdrs.superlib.net/ 然后随便搜索一本有试读的书,点击 试读版权页|前言页|目录页 |正文页 便可以看到类似以下链接:
英汉大词典 第2版
其中base之后的8位数字15044510便是一本书的SS号,它用来唯一标识超星图书馆中的一本书,相当于ISBN。如果已有一书需要知道其SS号,可以通过在全国图书馆参考咨询联盟
书签工具软件.rar (5.0 MB)