古希腊语汉语词典 & 拉丁语汉语词典 - 初步OCR

很早以前就想OCR这两本词典,但一直因为技术限制,很难处理。现在发现 Google 的 Gemini 2.0 Flash 大模型图像识别能力很强,于是初步OCR了一下。

不过因为图像底本清晰度不足等因素,要把它们做得比较完善是非常艰难耗时的,所以我目前对它们的态度是“管杀不管埋”,只自动OCR,且略微检视编辑了一下,并没有校对纠错等,请谨慎使用。

先贴在这里,看以后有没有机会进一步深入加工,其他网友感兴趣,也可以接手继续处理。

古希腊语汉语词典 罗念生、水建馥 编 - v0.1.txt (5.4 MB)

拉丁语汉语词典 谢大任 主编 - v0.1.txt (4.2 MB)

贴几个识别样本:

〈1〉

Α, α, άλφα, τό, 不变格,希腊文的第一个字母, 作为数字 a’ = eἷς 和 πρῶτος, α = 1000. 在 伊奥尼亚方言中, α作η, 如 σοφία 作 σοφίη. 在多里斯方言中,代替η, 如 ήδύς 作 αδύς. [前缀〕前缀的在元音前作αν. (1) α στερητικόν 具有“反义”的α, 如α-σοφος = α 反+ σοφός,不聪明. (2) α άθροιστικόν 作 “连系”用的a(合一,同一,等于),如ἀ- τάλαντος = α等于 + Τάλαντος, 同等重量的. (3) α ἐπιτατικόν 加强意义的α, 如ά- σπερχές = α加強+ σπερχές,很匆忙).(4) α εὔφωνον(不影响意义的)悦耳的α, 如α- στεροπή (电光) ( = α悅耳+ στεροπή), 这个 词的意义与 στεροπη 完全相同,但声音更好 听.
ἄ,a,& â,〔感叹词,表示惊讶,悲痛〕,啊! 唉!
〔亦作〕 〔惊喜声,欢笑声〕,哈哈!
a[a], [多),= [阿〕か
[a], [多], =[关系代词】
[a], = os的中,复.
[多],三,是的与.
ααατος [αα), ον, (α反, ἀάω), ①不可侵犯 的,不可亵渎的,神圣的.(常用作冥间的 Στ河的形容词.⇨Στύξ.)②决定性的(比 赛).③不可战胜的(力量).
α-αγῆς, ές, (α反,ἄγνωμι),折不断的,打不 破的,坚固的.
ααζω, (象声字),(开口)出气,送气(如发音 哈).
ἄανθα, ή, 耳环.
αάπλετος, ον, 〔史诗], = ἄπλετος 的延长体.
ἄ-απτος, ον, (α反,ἅπτομαι),不可触动 的,不可抗拒的,不可战胜的.
bas,〔是的属,ws],①明天.②后天.
ἄασα, αασάμην, αασθην, άάω.
ἀασμός, ὁ, (ἀάζω),出气,呼气,送气.
άάσχετος, ον, 〔诗〕,是ἄ-σχετος的延长体.
ἄαται, 是ἀάω²的3单.
ἄατος, 〔缩写)άτος, ον, (α反,ἄω, άσαι), 不 满足于…………………的,(+属). Αζης άτος πολέμοιο 不厌战的战神 Αζης.
ααω’,〔史诗,不过1,主动〕αασα〔āā, 亦作 aa],[缩写〕άσα,〔中动] ἀασάμην, [缩写) ἀσάμην,〔被动〕ἀάσθην, [现在时只见用3 单,中动] ἀᾶται, ①使受伤害,使(精神)错 乱,(神意,酒,灾难等)毁坏(某人).②[不 及,不过1,中动]昏聩,糊涂行事,
αάω, = αω, 满足.
άβα, (*), = ήβη.
α-βαθής, ές, (α反, βάθος), ①不深的.②[几]没有深度的,
ἀβακέω, (ἀβακής), 〔只见用不过2,3复 ἀβάκησαν),不言语,不答话,不理酥.
αβακής, ές, (α反, βάζω),①不会说话的,无 言的.②稚气的,沉静的.
αβακίζομαι, = ἀβακέω.
αβάκίσκος, ο, 〔是αβαξ的指小词〕,(镶嵌用 的)小石子.
α-βάκχευτος, ον (α反,βακχεύω),未经过酒 神的教仪的,没有欢乐的,
αβακχίωτος, ον,不能喝的(雨水),
άβαλε, = α βαλε,但愿……………………
αβαμβακευτος, ov,没有调味的(食品)、
ἄβαξ [α], ἄκος, o, ①石板.②(画几何图形 用的,撒上沙子的)石板.③(掷骰子用的)石 板.④一种雅典计投票票数的计数板.
αβάπτιστος, ον, (α反, βαπτίζω),不能浸 入水的,不能往下沉的(网).
ον, (α反, βάπτω),没有浸到水里ἀβαπτος,
的,没有淬火的,没有锻炼的.
ές, (α反,βάρος), I没有重量的,不α-βαρής,
沉重的,不成为累赘的,不成为负担的. II
〔喻〕不惹人不快的,不令人讨厌的,
ἄβαρις, ό, (α反,ẞapes),没有船的人,内陆 的人。
ά-βασάνιστος, ον, (α反, βασανίζω),未被拷 问的,[副]-τως.
αβάσκαντος, ον, (α反, βάσκανος), ①能避 魔法的,不受蛊惑的,不受伤害的.②〔主动〕 不伤害人的.
ά-βατος, ον [亦作〕 η, ον, (α反,βαίνω), ① 不可渡过的(河),不可践踏的(圣地),圣洁 的,贞洁的.②没有交配过的(母马).
ἀβάφης, ές, = αβαπτος.
Αβδηρίτης (ι), ου, ό, ①色雷斯境内的 Αβδηρα城的人.②〔喻〕笨人,头脑简单的 人.
ά-βέβαιος, οov, ①〔医〕不可靠的(治疗).②不 稳定的,反复无常的(友谊,命运).③情意不

〈1〉

A,a,拉丁语字母表第一个字母;<缩写>: A. = Aulus (人名);
A. = Augustus (人名); A. = Annus 年;A.A.A. = aurum, argentum, aes 金、银、铜; a. = antiquo 或 abdico 我反对或投票否决(在民众会议书面表决时用的缩写); a. = absolvo 我赦免(审判员书面表决时用的缩写); a.d. = ante diem 在…日之前; a.d. VIII Kalendas Novembres 在十一月初一的前七天(即十月二十五日); a.u.c. = ab urbe condita 或 anno urbis conditae 罗马建城纪元…年(即从公元前753年算起)。
ā, ab, abs, praep. cum abl. (a用于辅音前,ab 用于元音或辅音 h 前,abs 只用于辅音 c,q,t 前) 1.(空间): 1)从,由,来自: ab urbe proficisci 从城里出发; a coelo decidunt 从天上落下来; ab urbe abesse milia passuum ducenta 离罗马城二百(罗马)里; 2)在,从…方面: a tergo 在背后,从背后; a latere 从侧面; a septentrionibus 从北方; 2.(时间):1)从…以来,在…以后: ab hora tertia 三点钟以后; cujus a morte hic tertius et tricesimus annus 去世已三十三年; 2)从…开始,在…以上; rem omnem a principio audies, 你将从头听到一切情况, tirones ab sedecim annis milites scribebat 招募十六岁以上的人当新兵; 3.(从属关系)从,向: litterae a Caesare 恺撒的来信; discere ab aliquo 向某人学习; 4.(原因、动机) 由于,出于: id facinus natum a cupiditate 贪婪产生的罪恶; ab ira 出于忿怒; 5.(属性): dolere ab oculis 患眼疾; servus a pedibus 供差遣的奴隶; servus a manu 做文书工作的奴隶; 6.(区别、差异): quantum mutatus ab illo 他与那个人多么不相像啊; 7.(部分): nonnulli ab novissimi 后卫部队中的一些士兵; 8.(学生,信徒,门徒,追随者): Zeno et qui ab eo sunt 芝诺及其门徒; 9.(其他的关系); a defensione desistere 停止抵抗; initium capit ab aliqua re 从某事开始。
aasmus, i, m. 1) <医>咳嗽,百日咳; 2)喘息。
abacteriālis, e, adj. 无细菌的。
abactiō, ōnis, f. [ago] 1)驱赶; 2)抢劫。
abactor, ōris, m. 1)赶牲畜的人; 2)抢劫牲畜的人。
I abāctus, a, um, part. perf. < abigo.
II abāctus, ūs, m. [abigo] 1)驱赶; 2)抢劫。
abacus, i, m. <希> 1)计数板; 2)赌盘(in abaco ludere); 3)画板; 4)餐具柜; 5) <建>(圆柱顶部的)顶板; 6) <近>算盘.
ābaddir, indecl. m. 陨石。
ābaetō, -,-, ere, v.i. = abito.
abaliēnātiō ōnis, f. [abalieno] 1) 转让(所有权); 2)出售,脱手; 3)挑唆; 4) <医> ~ mentis 癫狂,精神错乱。
abaliēnō, āvi, ātum, āre, v.t. [ab+alieno] 1) 出让,转让: ~ agros 出让土地; 2)夺去,剥夺: abalienati jure civium 被剥夺公民权的人们; 3) <转>使昏倒,使丧失(sensus, mentem); 4)使疏远,使分离(aliquem ab aliqua re): ~ Campanos 同坎帕尼亚人疏远; 5)挑拨,离间: ~ a te judices 挑拨审判员与你的关系。
abaliud, adv. [ab+aliud] 从另一方面。
abalterutrum, adv. 彼此,相互之间。
abambulō, āvi, ātum, āre, v.i. [ab+ambulo]走,走开,离去。
abamita, ae, f. [avi amita]. 高祖姑母。
abante, adv… 在前面.
Abanteus, a, um, adj. < Abas.
abarceō, arcui, arctum, ere, v.t. [ab+arceo] 1)推开,击退; 2)排斥,拒绝。
Abaris, is (idis), m. 阿巴利斯1)斐内乌斯的伴侣;2)埃及的一座古城。
abarticulamentum, i, n. <解>关节。
Abās, antis, m. 阿巴斯(阿尔戈斯的国王,阿克里西乌斯的父亲,佩尔塞乌斯的祖父)。
abasia, ae, f. <医>不能步行,
abavia, ae, f. [avi+avia]. 高祖母,外高祖母。
abavunculus, i, m. [avi+avunculus] 高祖舅父(亦称 avunculus maximus).
abavus, i, m. [avi+avus] 1)高祖父,外高祖父; 2)始祖,祖先。
abaxiālis, e, adj. 1, <植>远轴的,离轴的; 2, 转向基部或腹部的。
abba, indecl. m. <希> 1) 父亲(= pater); 2)师父; 3) <宗>上帝。
abbaetō, -,-, ere, v.i. 1)走开,离去; 2)动身,启程; 3)去世,消失。
abbās, ātis, m. 修道院院长,
abbatia, ae, f. 修道院.
abbātiālis, e, adj. [abbatia] 修道院的。
abbatissa, ae, f. 女修道院院长。
abbitō, -, -, ere, v.i. = abito.
abbottina, ae, f. <动>棒花鱼属.
abbreviarium, i, n. 缩短,减少;摘录。
abbreviatiō, ōnis, f. [abbrevio] 1) 缩写,节略,省略; 2)缩写式,缩写词。
abbreviator, ōris, m. [abbrevio] 缩写者;节略者.
abbreviātus, a, um, adj. 缩短的,减轻的;省略的。
abbreviō, āvi, ātum, āre, v.t. 1)缩短(访问等),节略(读物等); 2)缩写,省略; 3)削弱,使衰弱。
abcidō, cīdī, cisum, ere, v.t. = abscido.
I Abdera, ae, f. 阿布德腊 1)古希腊色雷斯的海滨城市(今波利斯蒂洛或阿斯佩罗萨); 2)西班牙的城市(今阿德腊)。
II Abdera, ōrum, n. pl. = Abdera I.
Abdērītēs, ae, m. 阿布德腊城的居民。
abdicatio, ōnis, f. [abdico] 1) 否认,拒绝: ~ liberorum 同子女脱离关系; 2)放弃,辞掉: ~ dictaturae 辞去独裁执政官的职务。
abdicātīvē, adv. 1)否定地,不承认地; 2)消极地。
abdicātīvus, a, um, adj. 1) 否定的,不承认的; 2)消极的; 3)负的,阴极的。
I abdico, āvi, ātum, āre, v.t. 1) 否认,拒绝: ~ aliquem patrem 同某人脱离父子关系; 2)放弃,辞去(职务): ~ se magistratu 辞去官职; ~ dictaturam 放弃独裁执政官职; 3)撤消,废除: ~legem agrariam 废除土地法。
II abdico, dixi, dictum, ere, v.t. 1) (占卜用的术语)预示不祥之兆,占卜不吉利,2)禁止,反对(aliquid).
abditivus, a, um, adj. [abdo] 1) 远离的,分开的(a patre); 2)隐蔽的,潜伏的。
abditum, i, n. 1)隐蔽之处; 2)pl. 秘密: abdita rerum 自然界的奥秘。
abditus, a, um, 1. part. perf. < abdo; 2. adj. 1)隐蔽的,深藏的(sensus, sententia); 2)神秘的,秘密的: vis abdita quaedam 某种神秘的力量; res occultae et abditae 秘密的事情, 3)深奥的,难以理解的(a conspectu).
abdō, didi, ditum, ere, v.t. 1)使离开,移去,调走: ~ copias ab eo loco 把军队调离该地; 2)隐藏,藏匿: ~ se in suis tectis 躲在自己屋里; 3)使陷入,投入: ~se litteris (in litteris) 埋头读书,钻研学问,
abdōmen, inis, n. 1) <解>腹(部),肚子; 2) <转>贪食: abdominis voluptates 口腹之乐: ~ insaturabile 贪食无厌。
abdūcēns, entis, adj. [part. praes. < abduco] <医>外展的: ~ nervus 外展神经。
abdūcō, dūxi, ductum, ere v.t. 1)率领,带走,领出(legiones a Roma); ~ aliquem ex Hispania 从西班牙带出某人; 2)虏

5 个赞

https://projectzephyr.osdn.jp/furukawa-greek.html,之前从这个网站上下载过一个日语古希腊语的安装包,里面有词头文件body.html。
body.rar (2.6 MB).

2 个赞

不得不说,Gemini对polytonic greek的识别准确率令人惊讶。

拉丁语词典再上传一个用其他工具OCR的版本,格式是word文件。版面有点复杂难看,但识别结果也相对准确,深入加工的话,跟 Gemini OCR 的结果用软件工具对比校对,应该可以进一步提高正确率。

《古希腊语汉语词典》如果没有更高清晰度的图像底本的话,暂时没法提高识别准确度,原始图片肉眼有些字符都看不清楚。

拉丁语汉语词典 谢大任 主编(OCR).docx (16.6 MB)

添加一个《拉丁语汉语小词典》,也是初步用Gemini 2.0 Flash 识别,有待进一步校正。

拉丁语汉语小词典 谢大任 张廷琚 李文澜 编 - v0.1.txt (494.8 KB)

拉丁语汉语小词典(OCRed).pdf (9.7 MB)