如何编写软件全自动批量为超星读秀文献港图书馆联盟的PDF加入书签?

如果有一本扫描版电子书无书签要制作书签,需要找到每个章节和页码的对应关系,除了自己手工输入的笨办法,还有两种搜索方法。第一种是去出版社网站或者卖书的网站如当当京东搜索到该书的介绍,一般都有章节目录和页码信息的;另一种方法就是通过一个叫“晴天软件”的书签获取软件,输入书籍的超星的SS号就可获得。
获得了每个章节的页码之后,便可以用老马的PdgCntEditor软件给pdf添加书签了。
现在的问题是:如果我有成千上万本pdf需要制作书签怎么办?难道我要一本本手工去制作?多么浩大的工程!有没有办法自己编写程序全自动去做这件事?那个晴天软件是如何通过SS号去超星网站查找书签的?可以通过反编译看源代码吗?或者通过什么软件监视电脑与互联网的通信通过抓包来分析?具体怎么做呢?假设这第一步获得每个章节的页码可由程序自动完成,第二步就不难了,也许没办法用自己的程序来调用PdgCntEditor软件,但可以参考PDF的规范或者编程语言自身的API对PDF加入书签。
PYTHON/C++/C#/JAVA有什么PDF的API可调用吗?
我知道PDF 补丁丁 PDF补丁丁 - 博客园 这里开放了源码,可能对PDF处理有一些参考价值。但重点在第一步如何用软件去超星网站全自动批量获取书签。

附:何为超星电子书SS号?请注册登录http://www.ucdrs.superlib.net/ 然后随便搜索一本有试读的书,点击 试读版权页|前言页|目录页 |正文页 便可以看到类似以下链接:
英汉大词典 第2版
其中base之后的8位数字15044510便是一本书的SS号,它用来唯一标识超星图书馆中的一本书,相当于ISBN。如果已有一书需要知道其SS号,可以通过在全国图书馆参考咨询联盟

书签工具软件.rar (5.0 MB)

其实如果是自己看的话, 建议手动输入标签!

对扫描版词典添加cx书签没有什么意义,还是要像纸质版那样查,目录就是那个kid

友情提示
这些书签软件获取的书签 有的不是很准确,最后还是需要手动调整页码…
我手动添加书签的书并不多 都总能遇到
您这么大量的书如果全自动添加书签可能遇到的页码错误那就更多了

是的,词典添加书签意义不大。我主要问的是为非词典电子书添加书签

第一步麻烦,新书的话书签很玄学,看购书网站有没有,全凭运气,超星的书签虽然获取比较简单,有在线网站可以查,但超星都是旧书。第二步简单,pdftk 可以做到,我做了一个脚本用于导入书签到PDF,在之前的文章有分享过。

1 Like