只五分之一的內容,僅供參考。全書預計 1600 * 5
,體會到了吾生也有涯,而知也无涯,以有涯隨无涯,殆已。
形似字重災區:宮、官,論、倫,壤、壞,妹、姝,傅、傳,價、債,遣、遺,崇、祟,寥、廖,侍、待,令、今,末、未,已、巳,常、帝,尸、戶,土、士,傳、傅,羲、義,繫、擊,續、績。
tycheck.tar (395 KB)
只五分之一的內容,僅供參考。全書預計 1600 * 5
,體會到了吾生也有涯,而知也无涯,以有涯隨无涯,殆已。
形似字重災區:宮、官,論、倫,壤、壞,妹、姝,傅、傳,價、債,遣、遺,崇、祟,寥、廖,侍、待,令、今,末、未,已、巳,常、帝,尸、戶,土、士,傳、傅,羲、義,繫、擊,續、績。
tycheck.tar (395 KB)
目前流出版本质量都不太好,中华书局的又拿不到。只能取长补短,慢慢改吧。形似字导致的问题可以看下上面提供的文件
有意思!确实找出了不少错误。
Github版本 … … shaoshi 兄提供的版本 …
又王儉七志引劉向七略云 … 今二卷』,知其書錯繆多矣。又王檢《七志》引劉向《七略》云:『《易》傳子夏
这个Github版是日本版,后面我提供的版本指汉籍本。
这是用程式自动比对的吗?很厉害啊!
我们其实找到了一个很好的版本——儒家数字图书馆的,但是在发现后的几分钟内,该网站就挂了,就有这么巧。
不能光看错字量,得看错误率。错误率其实不算太高。
东里版ocr的错误恐怕也不少。东里版来自四库全书资料库——该资料库检索方式有所谓“正讹”,是将错就错,把可能出现的错字当成正确的字,一起检索的。
假设我们把日本版和汉籍版各自去掉标点,有可能通过Git来比较这两种版本吗?
做这种比较最强的工具是什么?我以为Git比较强。有更好的对比程式码?
准备试一下免费的winmerge。
23-10-2022
复核okayer的资料(很难查,先贴一部分):
〖子夏易傳 十一卷〗
然則令本又出僞託。
令本—>今本
〖周易鄭康成註 一卷〗
昂罕所稱引也。
今若祟儒。
昂—>即
祟—>崇
〖周易正義 十卷〗
輔嗣之註云。
之—>删除
按:这大概是万有文库版多打了一个字。刻本没有。
〖周易集解 十七卷〗
昂辨其本止十卷者。
昂—>即
〖周易口訣義 六卷〗
子夏傳既屬僞王。
王—>撰
〖周易舉正 三卷〗
序稱會得王輔嗣韓康伯手寫真本。
會—>曾
證其改旅卦斯字爲 之非。
爲 之非—>爲㒋之非。
=U+3000
〖易數鈎隱圖 三卷〗
八爲著數揲法。
令亦仍之焉
著—>蓍
令—>今
〖周易口義 十二卷〗
泰州如皇人。皇—>皋
董莾嚴陵集。莾—>𦯳 (殿本亦为𦯳,东里本此字误为“弅”)
壯于 有凶。壯于 —>壯于頄
=U+3000
王得臣塵史 塵史—>麈史
按:“塵史”一概替换为“麈史”。
〖東坡易傳 九卷〗
昆陵先生—>毘陵先生
【易傳 四卷】
則當成於編管浩州之後。
浩—>涪
〖易學辨惑 一卷〗
脩受之陳搏。
陳搏—>陳摶
陳搏出现22次,一概替换为陳摶。汉籍本也有二十几个,东里本只有个位数。
褎眨迥殊。
褎(同袖)—>褒
〖了翁易說 一卷〗
一切絕絶。
絕絶—>屏絕
則吉凶與民患之理。
吉凶與民患—>吉凶與民同患
恐非荃蹄之意云云。
按:“荃蹄”、“筌蹄”都对,但刻本是“筌蹄”,当改。
〖沖虛至德真經解 八卷〗
徵宗時始立三舍法。
徵宗—>徽宗
(全书共2见,可一概替换。汉籍本全书2见,可一概替换)
其他自己发现的资料:
东里“冡宰”当一概替换为“冢宰”。
〖雕邱雜錄 十八卷〗
領多勸戒之意。
領—>頗
汉籍本错误相同。
〖道藏目錄詳註 四卷〗
故今亦存共總目。
共—>其
〖須溪集 十卷〗
尤不免軟於繩墨之外。
軟—>軼
〖心泉學詩稿 六卷〗
若其人則疑以傅疑。
傅—>傳
〖陶菴全集 二十二卷〗
於王李鐘譚餘派。
鐘—>鍾
〖春秩詞命三卷〗
秩—>秋
“褎貶”一概替换为“褒贬”。
“褎”字无法一概替换为“褒”,又多得无法一一罗列,只好用find and replace一个个看。“褎口”、“褎然”用“褎”,其他的是“褒”。
〖御纂春秋直解 十五卷〗
自孫復倡爲有貶無褎之說。
褎—>褒
〖楊忠愍集 三卷〗
褎子—>褒予
儒家数字图书馆可以用了。这里的《四库提要》文字版,应该是全网最精良的吧?
可以保存网页。只碰到一页奇怪的情况,网页正中被插入巨量多的br,不过这片巨大空白前后的文字可以接续。各位可以注意一下有没有这种情况。
我已经手动保存了,以防万一。不过假如你有程式能抓这种用程式调出来的网页,倒是想向你学习。
儒家数字图书馆,估计必收十三经吧?你可以研究一下这里的十三经。
略微看了一下,没发现什么吸引我的资料。《四库提要》难道是特例?
看到不少简体字资料,没说明是什么版本。假如发现是四库本,我不会觉得太奇怪。
看了一下《苏东坡全集》,不吸引我。汉川草庐的繁体版《苏东坡全集》显然是《东坡七集》,比较有吸引力,所以我收集了。
现在在我这边,速度比较慢。等有空时再研究一下,看是否有特别一点的资料。
这个需要登录。不知道资料素质怎样。
儒家文化经典数据库
http://db.chinakongzi.org/index.php?m=books&c=source
似乎都和中国孔子网有关联。
或许儒家数字图书馆是不必登录的、面向一般公众的普通资料,而儒家文化经典数据库是高质量的资料,需要登录才能检索?
3-11-2022
〖漢上易集傳 十一卷〗
似述易傳。
似—>以
“王應鱗”(3次)一概替换为“王應麟”。
〖北海集 四十六卷〗
欲桂衣冠。
桂—>挂
〖周易窺餘 十五卷〗
此之初六
此—>比
〖易變體義 十二卷〗
群龍元首 —>群龍无首
皆末嘗卜筮
末嘗—>未嘗
〖周易古占法 一卷〗
朱程迥撰。 朱—>宋
迥寧可久 寧—>字
〖周易本義 十二卷〗
其辨最爲明晢。 明晢—>明晰
內府以宋槧募雕者。 募雕–>摹雕
側篇章分合。 側–>則
“卷未”(9次,除了“卷未刻”,8次应替换为“卷末”。)
日本版“筆塵”(3次)替换为“筆麈”。东里版“筆塵”(2次)替换为“筆麈”。
东里版“衰合”(2次)替换为“裒合”。
〖周易義海撮要 十二卷〗
衡字日彦平。 ----> 衡字彦平。
乃斥去雜學異家。 家---->說
文辭宄瑣。---->文辭冗瑣,
〖南軒易說 三卷〗
序未有鈎募舊本三小印。 序未---->序末
“進土”(9次)可一概替换为“進士”。
“未彝尊”(3次)可一概替换为“朱彝尊”。
“伏義”(4次)可一概替换为“伏羲”。
〖易說 四卷〗
末之有也。 末---->未
〖大易粹言 十卷〗
募印---->摹印
〖經鉏堂雜志 八卷〗
作鵬賦---->作鵩賦
稱思駁論時晦累疏。援引唐人及宋代累朝命相。皆用此語以駁思。
改:稱思駁論時。晦累疏。援引唐人及宋代累朝命相皆用此語,以駁思。
〖資塵新聞 七卷〗
資塵 ---->资麈
〖格齋 四六一卷〗
---->格齋四六 一卷
<經部書類結語>
右書類五十六部六百五十一卷附錄二部十一卷皆文淵閣著錄
—>右書類五十六部。六百五十一卷。附錄二部。十一卷。皆文淵閣著錄。
【<子部小說家類異聞結語>】
皆文淵著錄。 —>皆文淵閣著錄。
〖平巢事迹考 一卷〗
明茅元儀撰是編因明季流賊猖撅。—>明茅元儀撰。是編因明季流賊猖獗。
〖竹譜 一卷〗
舊本題晉載凱之撰。
載凱之 —> 戴凱之
8-11-2022
应该先确保核心资料正确。《四库提要》最重要的资料就是书名,其次是作者的名字。
日本版的书名错得挺多,其校对者显然不懂得抓重点。
累积太多了,先贴一部分。
“郞”替换为“郎”。
〖博物要賢 十六卷〗
【研山齋珍玩集賢 無卷數】
賢 —>覽
【于著作集 八卷】
于—>王
【歷代各臣芳躅 二卷】
各臣—>名臣
〖別木澹軒集 八卷〗
別木—>別本
【焦弱候問答 一卷】
候—>侯
【易裨傅 二卷】
【詩集傅 二十卷】
【慈湖詩傅 二十卷】
〖詩傳遺說 六卷〗謂今本集傅音叶。
傅—>傳
“經傅”(2次)替换为“經傳”。
【周易經專訓解 二卷】
經專—>經傳
【詩地埋考 六卷】
〖路史 四十七卷〗述上古至三代諸國姓氏地埋。
地埋—>地理
【太數外史 一卷】
太數—>太藪
【周易緯吏 無卷數】
吏—>史
〖周易析義 十五卷〗
〖校记〗“周易析义”当作“周易析疑”,参看《汇订》0321。
【類姓登科 考六卷】
—>類姓登科考 六卷
【易荃 六卷 附論 一卷】
荃—>筌
〖周易筌 四卷〗
周易筌—>廣易筌
〖西邨詩集 二卷〗
以爲不王世貞等所獎譽。—>以不爲王世貞等所獎譽。
當然太倉—>然當太倉
輾轉層增。—>輾轉屢增。
〖皇甫少玄集 二十六卷〗
其持論謂王守反元習之靡。
王守—>王宋
〖校记〗“皇甫少玄集”,《四库提要》避康熙讳作“皇甫少元集”。《中国文学家大辞典》:“皇甫涍(1497-1546)字子安,号少玄,又号潜山居士。”
【周易剩儀 二卷】
儀—>義
【周易蛾述 七十四卷】
述—>術
【易著圖說 十卷】
著—>蓍
〖易經辨異 四卷〗
異—>疑
【詩傳名物輯覽 十二卷】
輯—>集
此乃其摘錄附梓之本。
附梓—>付梓
〖春秋長曆 十卷〗
備引漢書續漢書晉書惰書
惰—>隋
〖諭語拾遺 一卷〗
諭語—>論語
【蕭韶考逸 二卷】
蕭—>簫
〖六書溯源 十二卷〗 (溯原作㴑)
獨玀闕象形一門。 “玀”字当删。
〖摭古遺丈 二卷〗
丈—>文
【古今韻分擺撮要 五卷】
擺—>註
【律古詞曲賦吐韻 十二卷】
吐韻—>叶韻
〖總韻持 三卷〗
總韻持—>韻總持
【韻學耍指 十一卷】
耍指—>要指
【朱季三朝政要 六卷】
朱季—>宋季
〖明大正記 二十五卷〗
大正—>大政
〖平臺紀略 十一卷〗
〖校记〗“平臺紀略一卷”,浙本作“平臺紀十一卷”,據殿本改。参看《汇订》1614。
【使流球錄 二卷】
流球—>琉球
【孔門弟子傳略 二卷】
〖校记〗“孔門”,底本作“孔子”,據殿本改。参看《匯訂》1941。
〖黃梁遺迹志 一卷〗
黃梁—>黄粱
〖璽昭錄 一卷〗
昭—>召
【御制人臣儆心錄 一卷】
制—>製
〖法帖刑誤 二卷〗
刑—>刊
〖辨感編 四卷〗
感—>惑
〖遵遒錄 八卷〗
遒—>道
〖范洛語錄 六卷〗
范—>苑
【巳未留 二卷】
“巳未留”(3次)一概替换为“己未留”。汉籍本亦出现3次。
【庸齋曰記 八卷】
曰—>日
〖心學宗法 四卷〗
“法”字当删。
〖夏侯最算經 三卷〗
最—>陽
〖璇璣遺術 七卷〗
術—>述
〖史徵 十二卷〗
史徵—>四言史徵
鐘國璽—>鍾國璽
〖大乙金鏡式經 十卷〗
大乙—>太乙
〖六千兵占 二卷〗
六千—>六壬
〖奇門要咯 一卷〗
要咯—>要略
〖範村菊譜 一卷〗
所居範村
範—>范
〖毫州牡丹志 一卷〗
毫—>亳
〖嗚道集說 一卷〗
嗚—>鳴
〖共發編 四卷〗
於汴字自梁。
於—>于
一一聯蜀於我。
蜀—>屬
〖湛澗靜語 二卷〗
澗—>淵
載理宗賜林。希逸詩一篇。—>載理宗賜林希逸詩一篇。
詩家未自引用者—>詩家未有引用者
至宋乃尊爲繩。 繩—>經
〖勤世恆言 一卷〗
勤世—>勸世
〖唾局隨錄 四卷〗
局—>居
〖續箋出房集略 十八卷〗
出—>山
〖閒雁齋筆談 六卷〗
閒—>聞
〖藝林剩說 十二卷〗
剩說—>剩語
亦稱其年方比於賈傳。 賈傳—>賈傅
〖藝林累 百八卷〗
—>〖藝林累百 八卷〗
〖蝶幾譜 一卷〗
是編因燕幾圖而變通之。燕幾以方幾
故曰蝶幾
燕幾圖頗巧雲。
幾—>几
雲—>云
按:这一条,日本人似乎被简、繁转换软件坑了。偷懒复制了简体字资料再转换?
〖歲華紀麗譜 一卷〗
〖校记〗“歲華紀麗譜”,浙本作“歲華記麗譜”,據殿本改。
〖治河通考 十卷〗
按:此条各本皆作“治河通考”,百度国学版误作“河治通考”,《汇订》误从百度国学版作“河治通考”。《汇订》沿袭百度国学版,此又一证。
〖閤皁山志 二卷〗
按:此条各本皆作“閤皁山志”,百度国学版误作“閤阜山志”,《汇订》误从百度国学版作“閤阜山志”。
〖東夷圖說 二卷〗
〖校记〗此条各本皆作“東南夷圖說”,然实际书名为“東夷圖說”,见《四库存目丛书》。
左傅(出现3次),可一概替换为“左傳”。
这条我没引《汇订》,直接就看了《四库存目丛书》的书目。
这是一套大书,好像是杜泽逊主编的,书目很可靠。你可以看《四库存目标注》。
或者检索"日本所藏中文古籍數據庫":
11-11-2022
用Access对比了百度国学版和日本版的词头,对不匹配的书名已经校对完。
日本版的书名错得挺多,校改这一轮后,应该说已经比较可靠。
〖介軒過筆 二卷〗
過—>遺
〖閱古隨筆績 二卷〗
正績閱古隨筆
績—>續
〖學古廷用篇 九十一條〗
廷—>適
〖增定玉壼冰 二卷〗
〖元壼雜俎 八卷〗
〖玉壼野史 十卷〗
壼—>壺
玉壼一概替换为玉壺
〖偶各紺珠 一卷〗
各—>得
〖翰叢鈔 十四卷〗
翰叢鈔—>翰苑叢鈔
〖事文類聚前 六十卷〗
前—>前集
〖荆州稗編 一百二十卷〗
荆州—>荆川
〖商唐近事 一卷〗
商唐—>南唐
〖鐵圍川叢談 六卷〗
川—>山
〖堂齋漫錄 一卷〗
堂—>高
〖過庭紀 餘三卷〗
—>過庭紀餘 三卷
〖丹麓雜者十種 十卷〗
皆筆高小品—>皆筆記小品
於其父乞銘—>爲其父乞銘
因金人西廂記評所說快事面演之。—>因金人瑞西廂記評所說快事而演之。(脱“瑞”字,“而”误作“面”)
〖丘陵學山 無卷數〗
明王文錄編。文錄有廉矩。
皆文錄自著之書。
錄—>祿
考訂宋精—>考訂未精
〖校记〗书名原避孔子讳作“邱陵學山”。
〖今古銘鈎元 四十卷〗
今古銘鈎元—>今古鈎玄
〖校记〗书名“今古鈎玄”原避康熙讳作“今古钩元”。
〖學仕在箴 五卷〗
在—>要
〖考史類編 十卷〗
考—>孝
〖寄園寄的寄 十一卷〗
寄園寄的寄—>寄園寄所寄
述山川保勝也。—>述山川名勝也
曰焚塵寄—>曰焚麈寄
裂眥寄—>曰裂眥寄
曰驅睡寄遺事之可爲談助者也。—>曰驅睡寄。遺事之可爲談助者也。
寄皆諧謔事也。—>皆諧謔事也。
第成小說家言而已。—>第成爲小說家言而已。
〖梨洲野乘 無卷數〗
〖校记〗浙本书名“黎洲野乘”,殿本作“棃洲野乘”,“棃”同“梨”。兹从殿本改为“梨洲野乘”。
〖正燈會元 二十卷〗
正—>五
〖弘明集 十四卷〗
鐘山—>鍾山
聖人這道—>聖人之道
〖校记〗书名原避乾隆讳作“宏明集”。
〖修真捷經 九卷〗
經—>徑
〖二六口課 一卷〗
口課—>功課
〖楚辭協韻 十卷〗
楚辭—>楚騷
〖讀騷列論 一卷〗
〖校记〗浙本书名原作“讀騷別論”,据殿本改。《四库存目丛书》书名为“讀騷列論”。
〖黎岳集 一卷〗
黎—>梨
〖諸真玄奧集成 九卷〗
明朱載瑋編。 瑋—>㙔
〖校记〗书名原避康熙讳作“諸真元奧集成”。
〖宛丘集 七十六卷〗
謂肥仙詩自然肥仙。南宋人稱耒之詞也。—>謂肥仙詩自然。肥仙。南宋人稱耒之詞也。
〖校记〗书名原避孔子讳作“宛邱集”。
〖實晉英光集 八卷〗
實—>寶
〖檆溪居士 十二卷〗
—>檆溪居士集
〖綱山集 八卷〗
綱—>網
〖惟實錄集 四卷〗
惟實錄—>惟實
〖友石山人遣稿 一卷〗
遣—>遺
〖玉仙璞稿 一卷〗
仙—>山
〖榮陽外史集 七十卷〗
榮—>滎
〖王合人詩集 五卷〗
合—>舍
〖曹明川集 一卷〗
明—>月
〖青風亭稿 七卷〗
青—>清
青風事稿—>清風亭稿
〖分類試齋文膾後集 十二卷〗
試齋—>誠齋
〖九露山房遺稿 五卷〗
露—>靈
〖玩梅亭詩集 二卷〗
游公鄉閒。
鄉—>卿
〖楊園全書 三十四卷〗
國朝張履詳撰。履詳 詳—>祥
張嘉珍閒。
張佩璁所閒。
閒—>問
多就桐鄉物十言之。 十—>土
故著錄於難家類焉。 難—>雜
〖陶山集 十四卷〗
文字這閒。—> 文字之閒
〖石閭詩 一卷〗
元號石閒。 閒—> 閭
〖春秋說 三十卷〗
朱洪咨夔撰。 朱—>宋
載吳潛折作咨夔行狀。 折—>所
〖己寬堂集 四卷〗 己—>已
言其子出己寬堂詩文二編。
己—>已
〖王己山文集 十卷〗
己—>已
〖五鵠別集 二卷〗
鵠—>鵲
〖汪禹又詩集 八卷〗 又—>乂
淮字禹又。 又—>乂
〖黃元龐詩集 八卷〗
龐—>龍
〖典澗遺稿 十五卷〗
典—>曲
〖思復嘗集 十卷〗 嘗—>堂
國朝邱廷采撰。 邱—>邵
〖校记〗“邵思淵”当作“陶思淵”,参看《汇订》6194。
〖綺榭閣稿 一卷〗
榭—>樹
〖校记〗作者“安箕”当作“安䈯”,参看《汇订》6205。
〖林左堂詩集 六卷〗
林—>杕
〖善卷堂 六十四卷〗
—>善卷堂四六 十卷
〖息盧詩 一卷〗
盧—>廬
〖錄蘿山房文集 二十四卷〗
錄—>綠
〖緣杉野屋集 四卷〗
緣—>綠
〖瀛奎律髓四 十九卷〗
—>瀛奎律髓 四十九卷
〖圭塘款乃集 二卷〗
款—>欸
〖二異人集 二十二卷〗
二—>三
〖廷陵書塾合璧 四卷〗
廷—>延
〖豔雪齋詩平 二卷〗
平—>評
《廣宏明集》的“宏”也是避讳字。《汇订》只在第一次出现时改。避讳字我有的自己改了,没有列出来。因为你跟《汇订》,《汇订》不热衷改避讳字。
《宏明集》我列出来,是因为引了自己改过的版本的资料,懒得再回改,所以把校记贴出来。
百度国学版改的避讳字最多,把《元包》改成《玄包》看来是改错了。
你可以自己检索百度国学版,看你要不要改某些避讳字。
但是《弘明集》、《宛丘集》都是有名的书,检索书目资料库随处可见。
【唐闕史二卷(浙江鮑士恭家藏本)】
張耒《宛邱〔丘〕集》
别的“鐘山”可以不管。鍾、鐘古通。主要是这个鍾山不知道是否和鐘有关。
你改不改,可以按照你自己的凡例,一律就行。
《汇订》这个凡例确实不好,因为没多少人是按顺序从头读到尾的。
假如不是有电子版可以检索,谁能知道到底改了没有?
像《弘明集》这种确凿无误应该回改的情况,还保留《宏明集》,只会误导读者。
儒家数字图书馆这个《提要》不能当作《汇订》来用,像这一条:
【易疑三卷(江蘇周厚堉家藏本)】
〖彙校〗
1.“江蘇”,殿本作“江西”,誤,《四庫採進書目》中“江蘇省第一次書目”著錄此書,而未見於“江西省呈送書目”。
〖校记〗《汇订》0218:“江蘇”,底本作“江西”,據殿本改。《四庫採進書目》中“江蘇省第一次書目”著錄此書,而未見於“江西省呈送書目”。
这个把《汇订》的意思说倒反了,是浙本错了,根据殿本改,反而说是殿本错了。
另外发现一些问题:
存搞 -->存稿
舊搞 -->舊稿
搞 -->稿
子云–>子雲 (扬雄字,必须一个一个看)
榖–>穀
【學范二卷(浙江巡撫採進本)】
本条“范”---->笵
【黃元龍詩集八卷附尺牘二卷(浙江巡撫採進本)】
本条资料错乱,抽出中间一句插入开端,乃资料保护程式所导致?
【杕左堂詩集六卷詞卷續集三卷(江西巡撫採進本)】
詞卷---->詞四卷
乙太學生 乙---->以
掛---->挂
23-11-2022 补充
把okayer兄提供的两本对比资料看完了,搞到有点“校对疲劳”。
次要的错字不报告了,再报告一则书名错误:
子部四十二
雜家類存目九
〖諸子裒異 十六卷〗
『江蘇周厚堉家藏本』
明江定國編。
諸子裒異(百度国学版也错了) —>諸子褒異
江定國 —>汪定國
上图的提要用的是百度国学版,繁体化,有些错字未改。
《汇订》也是百度国学版繁体化,然后再改的,有些地方还是漏改了,不过比上图版好得多。大改特改,不是行家就看不出痕迹。
ctext、虚阁也是百度国学版,这个版影响大。
儒家数字图书馆这个版应该是用《汇订》ocr后再改的。大概因为要避开版权纠纷,必须改得不一样。其引《汇订》的地方就是《汇订》,但是引用一书不能超过三分之一。
其《汇校》似乎想综合各家意见,有的意见我没找到出处。也许有自己的看法?