[存储终结者]欽定四庫全書薈要_四库全书荟要

景印摛藻堂四庫全書薈要,世界书局,1985

慎用!500册合计近40万张图片,总体积大概 160G,相当于一部大型单机游戏

GoldenDict_3Dr1B2S8tG

【檢索說明】
頁碼:加前綴P,如第一頁「P001-001」
書名:加前綴S,如查書籍「資治通鑒」,輸入「S資」
作者:加前綴Z,如查作者「司馬光」的書籍,輸入「Z司」
標題:加前綴T
總目:「C_總目」
分類目次:「C_分類目次」
分册目次:如「第002册」
分册細目:前綴P+册次,如第2册「P002」;或「C002_目次」

图像均有做透明处理,故背景色不喜欢可通过 css 自己调

PS:对于有这种大体积的 mdd 需要打包的,推荐使用 AutoMdxBuilder,能自动分包(反过来也支持批量解分包),正是这个需求加了这个功能

下载地址

链接:https://pan.baidu.com/s/11pm-RtV4yhIq_raH5dZyWg
提取码:18nc
–来自百度网盘超级会员V4的分享

19 个赞

其实分包大小 4G 以下就行。

1 个赞

像《四库全书》这种大小的书,是无法读的,只能检索利用

要善用本坛独家的“登楼”。这里面的《四库全书》不齐全,但是有其他的书,例如《四部丛刊》(善本)。

登楼古籍检索

摛藻堂《四库全书》是《四库全书》的精选本,给皇帝的特供。小得多,即便这样,现代人也读不了。

摛藻堂《四库全书》荟要全集(介绍)

摛藻堂四库全书荟要

一般认为《四库全书》的版本不好,《摛藻堂四库全书》比《四库全书》好。真要利用的话,用ctext大概比较方便。

不过大家应该给Mandolin的魄力点赞。这么大的书,能做出来不简单啊。

6 个赞

这荟要图像版,是两年前做了目录册,用文字版检索内容后想看下原书,可以通过目录册找到具体册次和页码,然后去翻 djvu 即可。

当时做了一半,现在有工具就干脆全做完了,整套荟要全搞下来,以后要看原书就方便得多了。

2 个赞

生产工具的质变带来了生产力的飞跃

2 个赞

花了8、9个小时,终于全部下载下来。试用一下还可以。但如果视图放大,则图片超界,如果缩小,则文字太不清晰,比较矛盾。使用pc版mdict。看楼主的图片好像是goldendict。我觉得用glodendict,导入文件还要占用空间,实在太大了。

:smile:,我也上传了 12 个小时

会超界么,应该是自适应宽度的,记得下 css 文件。另外还是建议尽量不用 Mdict,不清楚为什么目录册的图片加载不出来(GoldenDict 完全没问题):

我以《全唐詩》做检索例子:

1.《御定全唐詩》(《摛藻堂四庫全書薈要》本)

我要找“大珠小珠落玉盘”,在左边的“Search “御定全唐詩” for:”框内键入“大珠”,再点按“Search”。

检索结果:
《卷四百三十五》
嘈嘈切切錯雜彈大珠小珠落玉盤

点一下“38”旁边那个代表图像的标志,图像就出来了。

1 个赞

嗯嗯,确实方便,CTEX 这个项目很棒,做学问还得用这种。目前做的这个荟要只是满足自己的收藏和偶尔的欣赏需要,整理的过程也是认识古籍的过程。

1 个赞

我需要补充:ctext许多古籍是ocr的,检索定位就比较困难,有时定位不到。《全唐诗》已经有现成的电子文本,所以可以轻松定位。

这不是说你的书白做了,只是说要结合所有的资源而善用之。

别的不说,把你这套书收在电脑里,感觉像皇帝一样——当年只有皇帝能看到这部书,那也挺好的。

3 个赞

哈哈哈哈哈哈皇帝之譬甚为在理

也用goldendict打開,目錄都能找到,但怎麼從目錄進入內文呢?研究了半天也不會操作!比如這一頁。

感謝作者製作並上傳了這麼大的文件,我也用了一天時間下載完成。但試用的結果,說實話,挺難用的,無法做到順利跳轉。

好像有點兒明白了, pXXX-後的頁數,如果不足三位要加零,比如第七十頁,要寫成070 ,是否這樣?

1 个赞

这细目页就可以查具体书籍具体卷的页码,比如图中你要定位到「律詩 一百二十七首」,可以看到页码是 P385-133,那么在搜索框检索 P385-133(如果不足三位数要补0)即可:


精力所限,单靠个人的索引制作,目前定位的粒度暂时只这样了。(如果想实现自动跳转的话,得把目录册2000多张图片OCR校对,我想当前使用频率还不值得那样做)

想请教 Mandolin兄,我也想把一套多卷本的套书,弄成单一的图片辞典。

例如我有八册书的图,分别放在V1, V2…V8,每个资料夹各有几百张图。

请问在AutoMdxBuilder中要怎么设定,才能让词条/页码如您的四库荟要,形成如下"P008-561"的形式,并且抓到"008册"夹中的第561张图?

P008-561
<div_class=“pic”><img_src=“/008册/561.png”><_/div>

AutoMdxBuilder 目前还没有这个功能(暂时只支持单册书籍的自动制作),荟要的打包是我额外写脚本搞的,倒是可以考虑加进去(主要是多册的起始页和索引不好统一)。

1 个赞

感谢 Mandolin
原本想,一册一册用AutoMdxBuilder做完之后再全部合起来,但就连我这么不灵光的人,也能想出这样翻页会有问题。

多本装的词书或百科会有这种问题,页码索引中必须有册数,因此图片必须分夹放。
可是整合多个资料夹这一步真的好难做啊。

這是我找到的對應目錄:丛书子目-浙江大学大型文献库
希望已經下載的朋友或者樓主可以說明一下1-115的mdd每一個是對應的從多少冊到多少冊,這樣有利于快速下載到所要部份的書籍,而不至於全部下載。

1 个赞

曾经下载过,但多日不用就又不会用了,刚刚删掉了。说实话,在网络数据库如此丰富的今天,这样庞大的单机版已经没有多大价值。单机版制作应以小巧方便原则为准。