目前缺少扫描版或者电子版文本的日语单语词典列表

日语词典的电子化做的还是很不错的,国语词典很多已经制作了mdx版本
下面总结目前没有数据的日语词典列表,太久没有新版的还有一些特定类别(比如汉和辞典和外来语词典)就不列出了。
单语词典国内不容易买到,希望有相关资源的坛友能帮忙拍照或扫描,我会进行电子化

国語辞典

三省堂 現代新国語辞典 第七版
数据源:monokakido
三省堂 デイリーコンサイス国語辞典 第6版
目前没有电子版文本
三省堂 見やすい現代国語辞典

講談社 日本語大辞典 第二版
有epwing和ps2光盘版,但没有找到资源,第二版也有pdf

集英社国語辞典 第三版
目前只有纸质版

新潮現代国語辞典
目前只有纸质版

小学館 日本語新辞典
据说会在japanknowledge上线,中文版现已电子化,如果有数据可以制作为双解版

小学館 例解学習国語辞典 第十二版
数据源:monokakido
第十一版有mdx,其实小学用的词典还有好几本,不全列出了。

学研 現代新国語辞典 改訂第六版
学研 常用国語辞典 改訂第5版
学研 現代実用国語辞典
学研 新レインボー小学国語辞典 改訂第7版
学研 新レインボー はじめて国語辞典

角川 必携国語辞典

類語辞典

目前只有两本有数据,但没有制作为mdx
角川類語新辞典
日本語シソーラス 類語検索辞典 第2版

没有资源的
三省堂 新明解類語辞典
数据源:LogoVista
三省堂 類語新辞典
三省堂 必携 類語実用辞典 増補新版
三省堂 現代語古語類語辞典
三省堂 反対語対立語辞典
三省堂 類語ニュアンス辞典

小学館 ちがいがわかる類語使い分け辞典
小学館 使い方の分かる 類語例解辞典 新装版
数据源:JapanKnowledge
小学館 例解学習類語辞典 似たことば・仲間のことば

研究社 類義語使い分け辞典
数据源:LogoVista

講談社 類語辞典
講談社 類語大辞典

角川書店 類語国語辞典

学研 新レインボー 小学類語辞典
学研 大きな字の類語辞典

東京堂 日本語の類義表現辞典 新装版
東京堂 類語分類感覚表現辞典
東京堂 類語活用辞典 新装版
東京堂 反対語対照語辞典 新装版

古语词典

古语词典目前有mdx的也很少

旺文社 古語辞典 第十一版
有第十版pdf,也有app
旺文社 図解全訳古語辞典
似乎没有电子版

大修館書店 新全訳古語辞典
数据源:LogoVista
大修館書店 古語林
大修館書店 基本古語辞典 新装版

三省堂 詳説古語辞典
三省堂 全訳基本古語辞典
三省堂 新明解古語辞典 第三版
只有第二版pdf
三省堂 例解古語辞典 第三版

小学館 古語大辞典
小学館 全文全訳古語辞典
数据源:JapanKnowledge
小学館 全訳古語例解辞典
学研全訳古語辞典 改訂第二版
目前有第一版mdx

学研学習用例古語辞典 改訂第三版

ベネッセ全訳古語辞典
ベネッセ古語辞典
文英堂 全訳全解古語辞典
東書最新全訳古語辞典

其他词典

研究社 日本語コロケーション辞典
数据源:monokakido,LogoVista

三省堂 新明解語源辞典
目前只有纸质版

三省堂 当て字・当て読み 漢字表現辞典
目前只有纸质版

講談社 擬音語・擬態語辞典

講談社 日本語表現大辞典

岩波書店 日本の作家 名表現辞典

研究社 日本語口語表現辞典
似乎没有电子版,新版本也出了国内版

新明解日本語アクセント辞典 第2版 新装版
似乎没有电子版

这本初版有一个文字版的PDF,目前我在根据一个没有结构的mdx的基础上更改,现在只有增加@@@LINK优化搜索体验的工作了

1 Like

類語辞典还有一个,「類語玉手箱」(有mdx)的新版:
類語玉手箱 | 翻訳家やライター、ウェブ制作者などにオススメの無料日本語類語辞典サイト | 同義語 関連語 シソーラス 対義語

1 Like

手动插入吗,这工作量够大的,德语有好几本词典也是都有原版的,我现在正在研究一个新工具能结构化插入。

先查查ebwin格式,有的给话可复刻转换,没有再做ocr之类的工作。

查了下这两本是有epwing的:
三省堂 必携類語実用辞典
研究社 類義語使い分け辞典

虽说没有结构,但是有换行标签,再加上每个板块的自身标题什么的这些自带结构信息,所以写的python处理的

这个已经制作了文本版本的mdx,没分享。有pdf

这个一太郎和DONGRI都有

这隔壁已有人制作好mdx,是goo辞書还有时抓取制作的

这个已经制作了文本版本的mdx,没分享。

一版和二版都有mdx,没分享。这个logovista有,一版可以提取数据,但二版不行

2 Likes

三省堂的daily concise上过金山词霸日文版和本家的web dictionary。

学研的几部在两年前上过dongri,早下架了,学研不弄电子出版了。

旺文社古語有在Sharp的brain+,不过很快最新版就要在自家APP了。

講談社類語上过AppStore,早下架了。

小学馆的類語例解上过苹果词典。古語也有在Seiko的学生辞典,不过不可能拿得到权限。

别的都没有电子化,日本辞典xml化基本都digital assist做的(学研和小学馆除外),好奇哪些有电子版可以自己查官网,不过近几年三省堂和logovista开始自己弄了。

1 Like

编辑上限了,三省堂類語也上过AppStore,不过基本后来的新明解可以取代了。

感谢提供信息,ちがいがわかる類語使い分け辞典这本词典pdf在哪里可以找到呢

原来这些都有过电子版啊,之前没有抓取保留下来很可惜。

这个8800円也太贵了
找到了之前的版本,传一下
類語玉手箱.zip (5.9 MB)

チャレンジ小学国語辞典
本想凑单一起寄,
等着等着就绝版了。

补一本三省堂《新明解故事ことわざ辞典》,收录惯用句、故事成语、格言、名句等各色语汇。

另外商务印书馆引进的二版《日语口语词典》可以考虑合购再扫描转制成pdf文档。之前坛友自行ocr文本化的《明镜日汉词典》可以尝试同最新三版文本进行同词条文本行对齐,个别增补修正之处可以考虑用千问等ai模型逐一进行对译。

1 Like

俗语惯用语词典也有好多,我都没来得及整理,我查了一下发现日本词典业还真是发达,拟声拟态词和外来语都有好几本词典。

其实作用不大,日国大和各种国语辞典够查了,这里面没收的而这些专门辞典才有的一般碰不到,感觉用这些像掉书袋。拟声拟态主要对日语学习者有用,便于理解。外来语更是鸡肋,不如大辞泉收的全吧(不管科技术语的话)。

可以就现成已有的电子辞书资源进行整合,之前登楼语料库那哥们不是尝试过把各部同类语文词典串起来,可惜只停留在例句层面。如果能建设一个公有语料池,添加经过分词预处理的各种日语文献语料包括日汉互译对齐语料(语料收集渠道可以是安娜图书馆抓取电子书,可以是网友自发贡献的私藏电子书),方便查词时关联到各个实在语境中的句子,那比简单在词典中通过孤立句块(例句)把握词义有效多了。

再想得更远点,从日语词库中抽选出词频较高、覆盖率较大的前50000词,结合这部分词语在NLB、NLT等日语语料库搭配信息、情景例句、书写形式等信息元素,对日语学习的助益绝对很大。

我之前做过一部分工作,不过主要是词汇书和教材文章还有词汇表制作为anki包,比较麻烦的就是音频对齐。我只做完了《万词对策》和《大家的日语中级》,单词例句还有文章都和音频进行了逐句对齐,不过之前是手动处理的应该还是有错,我忙着备考也没时间仔细校对。其实我已经收集了主流教材和单词书的pdf的音频其他的还没整理。分词的话python结构化后直接用mecab很方便,我之前写过分词然后加furigana的脚本。词典现在主流的日汉词典我正在文本化,不过还是要写各种工具。我还在文本化另外几个日汉词典,包括形容词和副词专门的词典和日汉辞海。

1 Like

从我这个过来人的经验来说,日汉双解词典的数字文本化工作十分艰巨,所得不偿所失。我着手进行ocr转制的俞彭年主编的《现代日汉双解词典》内页正文足有千八百页之多,经历两个校次,每一百页用时约三个半小时到四个半小时,饶是如此也还有进一步打磨空间。而你想要文本化的任一本双语词典,体量都比俞书来的大,而且内文词条所涉辞书编纂符号也更繁杂,还有词句夹标注音假名识读写录也是一大难题,估计一本下来就得耗费一百多个小时。你只有真正着手去做,才会真正体会到“言易行难”:sweat_smile:

1 Like