Japan 版 四库提要 合作校对贴

目前流出版本质量都不太好,中华书局的又拿不到。只能取长补短,慢慢改吧。形似字导致的问题可以看下上面提供的文件

有意思!确实找出了不少错误。

Github版本 … … shaoshi 兄提供的版本 …
又王儉七志引劉向七略云 … 今二卷』,知其書錯繆多矣。又王檢《七志》引劉向《七略》云:『《易》傳子夏

这个Github版是日本版,后面我提供的版本指汉籍本。

这是用程式自动比对的吗?很厉害啊!

我们其实找到了一个很好的版本——儒家数字图书馆的,但是在发现后的几分钟内,该网站就挂了,就有这么巧。

不能光看错字量,得看错误率。错误率其实不算太高。

东里版ocr的错误恐怕也不少。东里版来自四库全书资料库——该资料库检索方式有所谓“正讹”,是将错就错,把可能出现的错字当成正确的字,一起检索的。

假设我们把日本版和汉籍版各自去掉标点,有可能通过Git来比较这两种版本吗?

做这种比较最强的工具是什么?我以为Git比较强。有更好的对比程式码?

准备试一下免费的winmerge。

23-10-2022

复核okayer的资料(很难查,先贴一部分):

〖子夏易傳 十一卷〗
然則令本又出僞託。
令本—>今本

〖周易鄭康成註 一卷〗
昂罕所稱引也。
今若祟儒。
昂—>即
祟—>崇

〖周易正義 十卷〗
輔嗣之註云。
之—>删除
按:这大概是万有文库版多打了一个字。刻本没有。

〖周易集解 十七卷〗
昂辨其本止十卷者。
昂—>即

〖周易口訣義 六卷〗
子夏傳既屬僞王。
王—>撰

〖周易舉正 三卷〗
序稱會得王輔嗣韓康伯手寫真本。
會—>曾
證其改旅卦斯字爲 之非。
爲 之非—>爲㒋之非。
=U+3000

〖易數鈎隱圖 三卷〗
八爲著數揲法。
令亦仍之焉
著—>蓍
令—>今

〖周易口義 十二卷〗
泰州如皇人。皇—>皋
董莾嚴陵集。莾—>𦯳 (殿本亦为𦯳,东里本此字误为“弅”)
壯于 有凶。壯于 —>壯于頄
=U+3000
王得臣塵史 塵史—>麈史
按:“塵史”一概替换为“麈史”。

〖東坡易傳 九卷〗
昆陵先生—>毘陵先生

【易傳 四卷】
則當成於編管浩州之後。
浩—>涪

〖易學辨惑 一卷〗
脩受之陳搏。
陳搏—>陳摶
陳搏出现22次,一概替换为陳摶。汉籍本也有二十几个,东里本只有个位数。

褎眨迥殊。
褎(同袖)—>褒

〖了翁易說 一卷〗
一切絕絶。
絕絶—>屏絕

則吉凶與民患之理。
吉凶與民患—>吉凶與民同患

恐非荃蹄之意云云。
按:“荃蹄”、“筌蹄”都对,但刻本是“筌蹄”,当改。

〖沖虛至德真經解 八卷〗
徵宗時始立三舍法。
徵宗—>徽宗
(全书共2见,可一概替换。汉籍本全书2见,可一概替换)

其他自己发现的资料:

东里“冡宰”当一概替换为“冢宰”。

〖雕邱雜錄 十八卷〗
領多勸戒之意。
領—>頗
汉籍本错误相同。

〖道藏目錄詳註 四卷〗
故今亦存共總目。
共—>其

〖須溪集 十卷〗
尤不免軟於繩墨之外。
軟—>軼

〖心泉學詩稿 六卷〗
若其人則疑以傅疑。
傅—>傳

〖陶菴全集 二十二卷〗
於王李鐘譚餘派。
鐘—>鍾

〖春秩詞命三卷〗
秩—>秋

“褎貶”一概替换为“褒贬”。

“褎”字无法一概替换为“褒”,又多得无法一一罗列,只好用find and replace一个个看。“褎口”、“褎然”用“褎”,其他的是“褒”。

〖御纂春秋直解 十五卷〗
自孫復倡爲有貶無褎之說。
褎—>褒

〖楊忠愍集 三卷〗
褎子—>褒予

儒家数字图书馆可以用了。这里的《四库提要》文字版,应该是全网最精良的吧?

可以保存网页。只碰到一页奇怪的情况,网页正中被插入巨量多的br,不过这片巨大空白前后的文字可以接续。各位可以注意一下有没有这种情况。

我已经手动保存了,以防万一。不过假如你有程式能抓这种用程式调出来的网页,倒是想向你学习。

儒家数字图书馆,估计必收十三经吧?你可以研究一下这里的十三经。

1 个赞

略微看了一下,没发现什么吸引我的资料。《四库提要》难道是特例?

看到不少简体字资料,没说明是什么版本。假如发现是四库本,我不会觉得太奇怪。

看了一下《苏东坡全集》,不吸引我。汉川草庐的繁体版《苏东坡全集》显然是《东坡七集》,比较有吸引力,所以我收集了。

现在在我这边,速度比较慢。等有空时再研究一下,看是否有特别一点的资料。

这个需要登录。不知道资料素质怎样。

儒家文化经典数据库
http://db.chinakongzi.org/index.php?m=books&c=source

似乎都和中国孔子网有关联。

或许儒家数字图书馆是不必登录的、面向一般公众的普通资料,而儒家文化经典数据库是高质量的资料,需要登录才能检索?

3-11-2022

〖漢上易集傳 十一卷〗
似述易傳。
似—>以

“王應鱗”(3次)一概替换为“王應麟”。

〖北海集 四十六卷〗
欲桂衣冠。
桂—>挂

〖周易窺餘 十五卷〗
此之初六
此—>比

〖易變體義 十二卷〗
群龍元首 —>群龍无首
皆末嘗卜筮
末嘗—>未嘗

〖周易古占法 一卷〗
朱程迥撰。 朱—>宋
迥寧可久 寧—>字

〖周易本義 十二卷〗
其辨最爲明晢。 明晢—>明晰

內府以宋槧募雕者。 募雕–>摹雕

側篇章分合。 側–>則

“卷未”(9次,除了“卷未刻”,8次应替换为“卷末”。)

日本版“筆塵”(3次)替换为“筆麈”。东里版“筆塵”(2次)替换为“筆麈”。

东里版“衰合”(2次)替换为“裒合”。

〖周易義海撮要 十二卷〗
衡字日彦平。 ----> 衡字彦平。
乃斥去雜學異家。 家---->說
文辭宄瑣。---->文辭冗瑣,

〖南軒易說 三卷〗
序未有鈎募舊本三小印。 序未---->序末

“進土”(9次)可一概替换为“進士”。

“未彝尊”(3次)可一概替换为“朱彝尊”。

“伏義”(4次)可一概替换为“伏羲”。

〖易說 四卷〗
末之有也。 末---->未

〖大易粹言 十卷〗
募印---->摹印

〖經鉏堂雜志 八卷〗
作鵬賦---->作鵩賦
稱思駁論時晦累疏。援引唐人及宋代累朝命相。皆用此語以駁思。
改:稱思駁論時。晦累疏。援引唐人及宋代累朝命相皆用此語,以駁思。

〖資塵新聞 七卷〗
資塵 ---->资麈

〖格齋 四六一卷〗
---->格齋四六 一卷

<經部書類結語>
右書類五十六部六百五十一卷附錄二部十一卷皆文淵閣著錄
—>右書類五十六部。六百五十一卷。附錄二部。十一卷。皆文淵閣著錄。

【<子部小說家類異聞結語>】
皆文淵著錄。 —>皆文淵閣著錄。

〖平巢事迹考 一卷〗
明茅元儀撰是編因明季流賊猖撅。—>明茅元儀撰。是編因明季流賊猖獗。

〖竹譜 一卷〗
舊本題晉載凱之撰。
載凱之 —> 戴凱之

1 个赞

8-11-2022

应该先确保核心资料正确。《四库提要》最重要的资料就是书名,其次是作者的名字。

日本版的书名错得挺多,其校对者显然不懂得抓重点。

累积太多了,先贴一部分。

“郞”替换为“郎”。

〖博物要賢 十六卷〗
【研山齋珍玩集賢 無卷數】
賢 —>覽

【于著作集 八卷】
于—>王

【歷代各臣芳躅 二卷】
各臣—>名臣

〖別木澹軒集 八卷〗
別木—>別本

【焦弱候問答 一卷】
候—>侯

【易裨傅 二卷】
【詩集傅 二十卷】
【慈湖詩傅 二十卷】
〖詩傳遺說 六卷〗謂今本集傅音叶。
傅—>傳

“經傅”(2次)替换为“經傳”。

【周易經專訓解 二卷】
經專—>經傳

【詩地埋考 六卷】
〖路史 四十七卷〗述上古至三代諸國姓氏地埋。
地埋—>地理

【太數外史 一卷】
太數—>太藪

【周易緯吏 無卷數】
吏—>史

〖周易析義 十五卷〗
〖校记〗“周易析义”当作“周易析疑”,参看《汇订》0321。

【類姓登科 考六卷】
—>類姓登科考 六卷

【易荃 六卷 附論 一卷】
荃—>筌

〖周易筌 四卷〗
周易筌—>廣易筌

〖西邨詩集 二卷〗
以爲不王世貞等所獎譽。—>以不爲王世貞等所獎譽。
當然太倉—>然當太倉
輾轉層增。—>輾轉屢增。

〖皇甫少玄集 二十六卷〗
其持論謂王守反元習之靡。
王守—>王宋
〖校记〗“皇甫少玄集”,《四库提要》避康熙讳作“皇甫少元集”。《中国文学家大辞典》:“皇甫涍(1497-1546)字子安,号少玄,又号潜山居士。”

【周易剩儀 二卷】
儀—>義

【周易蛾述 七十四卷】
述—>術

【易著圖說 十卷】
著—>蓍

〖易經辨異 四卷〗
異—>疑

【詩傳名物輯覽 十二卷】
輯—>集

此乃其摘錄附梓之本。
附梓—>付梓

〖春秋長曆 十卷〗
備引漢書續漢書晉書惰書
惰—>隋

〖諭語拾遺 一卷〗
諭語—>論語

【蕭韶考逸 二卷】
蕭—>簫

〖六書溯源 十二卷〗 (溯原作㴑)
獨玀闕象形一門。 “玀”字当删。

〖摭古遺丈 二卷〗
丈—>文

【古今韻分擺撮要 五卷】
擺—>註

【律古詞曲賦吐韻 十二卷】
吐韻—>叶韻

〖總韻持 三卷〗
總韻持—>韻總持

【韻學耍指 十一卷】
耍指—>要指

【朱季三朝政要 六卷】
朱季—>宋季

〖明大正記 二十五卷〗
大正—>大政

〖平臺紀略 十一卷〗
〖校记〗“平臺紀略一卷”,浙本作“平臺紀十一卷”,據殿本改。参看《汇订》1614。

【使流球錄 二卷】
流球—>琉球

【孔門弟子傳略 二卷】
〖校记〗“孔門”,底本作“孔子”,據殿本改。参看《匯訂》1941。

〖黃梁遺迹志 一卷〗
黃梁—>黄粱

〖璽昭錄 一卷〗
昭—>召

【御制人臣儆心錄 一卷】
制—>製

〖法帖刑誤 二卷〗
刑—>刊

〖辨感編 四卷〗
感—>惑

〖遵遒錄 八卷〗
遒—>道

〖范洛語錄 六卷〗
范—>苑

【巳未留 二卷】
“巳未留”(3次)一概替换为“己未留”。汉籍本亦出现3次。

【庸齋曰記 八卷】
曰—>日

〖心學宗法 四卷〗
“法”字当删。

〖夏侯最算經 三卷〗
最—>陽

〖璇璣遺術 七卷〗
術—>述

〖史徵 十二卷〗
史徵—>四言史徵
鐘國璽—>鍾國璽

〖大乙金鏡式經 十卷〗
大乙—>太乙

〖六千兵占 二卷〗
六千—>六壬

〖奇門要咯 一卷〗
要咯—>要略

〖範村菊譜 一卷〗
所居範村
範—>范

〖毫州牡丹志 一卷〗
毫—>亳

〖嗚道集說 一卷〗
嗚—>鳴

〖共發編 四卷〗
於汴字自梁。
於—>于
一一聯蜀於我。
蜀—>屬

〖湛澗靜語 二卷〗
澗—>淵
載理宗賜林。希逸詩一篇。—>載理宗賜林希逸詩一篇。
詩家未自引用者—>詩家未有引用者
至宋乃尊爲繩。 繩—>經

〖勤世恆言 一卷〗
勤世—>勸世

〖唾局隨錄 四卷〗
局—>居

〖續箋出房集略 十八卷〗
出—>山

〖閒雁齋筆談 六卷〗
閒—>聞

〖藝林剩說 十二卷〗
剩說—>剩語
亦稱其年方比於賈傳。 賈傳—>賈傅

〖藝林累 百八卷〗
—>〖藝林累百 八卷〗

〖蝶幾譜 一卷〗
是編因燕幾圖而變通之。燕幾以方幾
故曰蝶幾
燕幾圖頗巧雲。
幾—>几
雲—>云
按:这一条,日本人似乎被简、繁转换软件坑了。偷懒复制了简体字资料再转换?

〖歲華紀麗譜 一卷〗
〖校记〗“歲華紀麗譜”,浙本作“歲華記麗譜”,據殿本改。

〖治河通考 十卷〗
按:此条各本皆作“治河通考”,百度国学版误作“河治通考”,《汇订》误从百度国学版作“河治通考”。《汇订》沿袭百度国学版,此又一证。

〖閤皁山志 二卷〗
按:此条各本皆作“閤皁山志”,百度国学版误作“閤阜山志”,《汇订》误从百度国学版作“閤阜山志”。

〖東夷圖說 二卷〗
〖校记〗此条各本皆作“東南夷圖說”,然实际书名为“東夷圖說”,见《四库存目丛书》。

左傅(出现3次),可一概替换为“左傳”。

1 个赞

这条我没引《汇订》,直接就看了《四库存目丛书》的书目。

这是一套大书,好像是杜泽逊主编的,书目很可靠。你可以看《四库存目标注》。

或者检索"日本所藏中文古籍數據庫":

http://kanji.zinbun.kyoto-u.ac.jp/kanseki?query=東夷圖說

11-11-2022

用Access对比了百度国学版和日本版的词头,对不匹配的书名已经校对完。

日本版的书名错得挺多,校改这一轮后,应该说已经比较可靠。

〖介軒過筆 二卷〗
過—>遺

〖閱古隨筆績 二卷〗
正績閱古隨筆
績—>續

〖學古廷用篇 九十一條〗
廷—>適

〖增定玉壼冰 二卷〗
〖元壼雜俎 八卷〗
〖玉壼野史 十卷〗
壼—>壺
玉壼一概替换为玉壺

〖偶各紺珠 一卷〗
各—>得

〖翰叢鈔 十四卷〗
翰叢鈔—>翰苑叢鈔

〖事文類聚前 六十卷〗
前—>前集

〖荆州稗編 一百二十卷〗
荆州—>荆川

〖商唐近事 一卷〗
商唐—>南唐

〖鐵圍川叢談 六卷〗
川—>山

〖堂齋漫錄 一卷〗
堂—>高

〖過庭紀 餘三卷〗
—>過庭紀餘 三卷

〖丹麓雜者十種 十卷〗
皆筆高小品—>皆筆記小品
於其父乞銘—>爲其父乞銘
因金人西廂記評所說快事面演之。—>因金人瑞西廂記評所說快事而演之。(脱“瑞”字,“而”误作“面”)

〖丘陵學山 無卷數〗
明王文錄編。文錄有廉矩。
皆文錄自著之書。
錄—>祿
考訂宋精—>考訂未精
〖校记〗书名原避孔子讳作“邱陵學山”。

〖今古銘鈎元 四十卷〗
今古銘鈎元—>今古鈎玄
〖校记〗书名“今古鈎玄”原避康熙讳作“今古钩元”。

〖學仕在箴 五卷〗
在—>要

〖考史類編 十卷〗
考—>孝

〖寄園寄的寄 十一卷〗
寄園寄的寄—>寄園寄所寄
述山川保勝也。—>述山川名勝也
曰焚塵寄—>曰焚麈寄
裂眥寄—>曰裂眥寄
曰驅睡寄遺事之可爲談助者也。—>曰驅睡寄。遺事之可爲談助者也。
寄皆諧謔事也。—>皆諧謔事也。
第成小說家言而已。—>第成爲小說家言而已。

〖梨洲野乘 無卷數〗
〖校记〗浙本书名“黎洲野乘”,殿本作“棃洲野乘”,“棃”同“梨”。兹从殿本改为“梨洲野乘”。

〖正燈會元 二十卷〗
正—>五

〖弘明集 十四卷〗
鐘山—>鍾山
聖人這道—>聖人之道
〖校记〗书名原避乾隆讳作“宏明集”。

〖修真捷經 九卷〗
經—>徑

〖二六口課 一卷〗
口課—>功課

〖楚辭協韻 十卷〗
楚辭—>楚騷

〖讀騷列論 一卷〗
〖校记〗浙本书名原作“讀騷別論”,据殿本改。《四库存目丛书》书名为“讀騷列論”。

〖黎岳集 一卷〗
黎—>梨

〖諸真玄奧集成 九卷〗
明朱載瑋編。 瑋—>㙔
〖校记〗书名原避康熙讳作“諸真元奧集成”。

〖宛丘集 七十六卷〗
謂肥仙詩自然肥仙。南宋人稱耒之詞也。—>謂肥仙詩自然。肥仙。南宋人稱耒之詞也。
〖校记〗书名原避孔子讳作“宛邱集”。

〖實晉英光集 八卷〗
實—>寶

〖檆溪居士 十二卷〗
—>檆溪居士集

〖綱山集 八卷〗
綱—>網

〖惟實錄集 四卷〗
惟實錄—>惟實

〖友石山人遣稿 一卷〗
遣—>遺

〖玉仙璞稿 一卷〗
仙—>山

〖榮陽外史集 七十卷〗
榮—>滎

〖王合人詩集 五卷〗
合—>舍

〖曹明川集 一卷〗
明—>月

〖青風亭稿 七卷〗
青—>清
青風事稿—>清風亭稿

〖分類試齋文膾後集 十二卷〗
試齋—>誠齋

〖九露山房遺稿 五卷〗
露—>靈

〖玩梅亭詩集 二卷〗
游公鄉閒。
鄉—>卿

〖楊園全書 三十四卷〗
國朝張履詳撰。履詳 詳—>祥
張嘉珍閒。
張佩璁所閒。
閒—>問

多就桐鄉物十言之。 十—>土
故著錄於難家類焉。 難—>雜

〖陶山集 十四卷〗
文字這閒。—> 文字之閒

〖石閭詩 一卷〗
元號石閒。 閒—> 閭

〖春秋說 三十卷〗
朱洪咨夔撰。 朱—>宋
載吳潛折作咨夔行狀。 折—>所

〖己寬堂集 四卷〗 己—>已
言其子出己寬堂詩文二編。
己—>已

〖王己山文集 十卷〗
己—>已

〖五鵠別集 二卷〗
鵠—>鵲

〖汪禹又詩集 八卷〗 又—>乂
淮字禹又。 又—>乂

〖黃元龐詩集 八卷〗
龐—>龍

〖典澗遺稿 十五卷〗
典—>曲

〖思復嘗集 十卷〗 嘗—>堂
國朝邱廷采撰。 邱—>邵
〖校记〗“邵思淵”当作“陶思淵”,参看《汇订》6194。

〖綺榭閣稿 一卷〗
榭—>樹
〖校记〗作者“安箕”当作“安䈯”,参看《汇订》6205。

〖林左堂詩集 六卷〗
林—>杕

〖善卷堂 六十四卷〗
—>善卷堂四六 十卷

〖息盧詩 一卷〗
盧—>廬

〖錄蘿山房文集 二十四卷〗
錄—>綠

〖緣杉野屋集 四卷〗
緣—>綠

〖瀛奎律髓四 十九卷〗
—>瀛奎律髓 四十九卷

〖圭塘款乃集 二卷〗
款—>欸

〖二異人集 二十二卷〗
二—>三

〖廷陵書塾合璧 四卷〗
廷—>延

〖豔雪齋詩平 二卷〗
平—>評

2 个赞

《廣宏明集》的“宏”也是避讳字。《汇订》只在第一次出现时改。避讳字我有的自己改了,没有列出来。因为你跟《汇订》,《汇订》不热衷改避讳字。

《宏明集》我列出来,是因为引了自己改过的版本的资料,懒得再回改,所以把校记贴出来。

百度国学版改的避讳字最多,把《元包》改成《玄包》看来是改错了。

你可以自己检索百度国学版,看你要不要改某些避讳字。

但是《弘明集》、《宛丘集》都是有名的书,检索书目资料库随处可见。

【唐闕史二卷(浙江鮑士恭家藏本)】
張耒《宛邱〔丘〕集》

别的“鐘山”可以不管。鍾、鐘古通。主要是这个鍾山不知道是否和鐘有关。

你改不改,可以按照你自己的凡例,一律就行。

1 个赞

《汇订》这个凡例确实不好,因为没多少人是按顺序从头读到尾的。

假如不是有电子版可以检索,谁能知道到底改了没有?

像《弘明集》这种确凿无误应该回改的情况,还保留《宏明集》,只会误导读者。

儒家数字图书馆这个《提要》不能当作《汇订》来用,像这一条:

【易疑三卷(江蘇周厚堉家藏本)】
〖彙校〗
1.“江蘇”,殿本作“江西”,誤,《四庫採進書目》中“江蘇省第一次書目”著錄此書,而未見於“江西省呈送書目”。
〖校记〗《汇订》0218:“江蘇”,底本作“江西”,據殿本改。《四庫採進書目》中“江蘇省第一次書目”著錄此書,而未見於“江西省呈送書目”。

这个把《汇订》的意思说倒反了,是浙本错了,根据殿本改,反而说是殿本错了。

另外发现一些问题:

存搞 -->存稿
舊搞 -->舊稿
搞 -->稿
子云–>子雲 (扬雄字,必须一个一个看)
榖–>穀

【學范二卷(浙江巡撫採進本)】
本条“范”---->笵

【黃元龍詩集八卷附尺牘二卷(浙江巡撫採進本)】
本条资料错乱,抽出中间一句插入开端,乃资料保护程式所导致?

【杕左堂詩集六卷詞卷續集三卷(江西巡撫採進本)】
詞卷---->詞四卷
乙太學生 乙---->以

掛---->挂

23-11-2022 补充

把okayer兄提供的两本对比资料看完了,搞到有点“校对疲劳”。

次要的错字不报告了,再报告一则书名错误:

子部四十二
雜家類存目九
〖諸子裒異 十六卷〗
『江蘇周厚堉家藏本』
明江定國編。

諸子裒異(百度国学版也错了) —>諸子褒異

江定國 —>汪定國

1 个赞

上图的提要用的是百度国学版,繁体化,有些错字未改。

《汇订》也是百度国学版繁体化,然后再改的,有些地方还是漏改了,不过比上图版好得多。大改特改,不是行家就看不出痕迹。

ctext、虚阁也是百度国学版,这个版影响大。

儒家数字图书馆这个版应该是用《汇订》ocr后再改的。大概因为要避开版权纠纷,必须改得不一样。其引《汇订》的地方就是《汇订》,但是引用一书不能超过三分之一。

其《汇校》似乎想综合各家意见,有的意见我没找到出处。也许有自己的看法?