目前缺少扫描版或者电子版文本的日语单语词典列表

日语词典的电子化做的还是很不错的,国语词典很多已经制作了mdx版本
下面总结目前没有数据的日语词典列表,太久没有新版的还有一些特定类别(比如汉和辞典和外来语词典)就不列出了。
单语词典国内不容易买到,希望有相关资源的坛友能帮忙拍照或扫描,我会进行电子化

国語辞典

三省堂 現代新国語辞典 第七版
数据源:monokakido, logovista
已制作mdx:三省堂 現代新国語辞典 第七版 mdx

三省堂 デイリーコンサイス国語辞典 第6版
目前没有电子版文本
三省堂 見やすい現代国語辞典

講談社 日本語大辞典 第二版
已制作ps2版,将整合图片和中文版
ps2版:PS2 《日本语大词典》 格式分析和解压脚本(mdx已经制作)

集英社国語辞典 第三版
已买到纸质版,待扫描

新潮現代国語辞典
目前只有纸质版
已扫描:新潮现代国語辞典 第二版 扫描图片和ocr数据(同时征集其他几本辞典电子版)

小学館 日本語新辞典
据说会在japanknowledge上线,中文版现已电子化,如果有数据可以制作为双解版
已经有拍照整合版:小学館日本語新辞典

小学館 例解学習国語辞典 第十二版
数据源:monokakido
已有mdx:

学研 現代新国語辞典 改訂第六版
已买到纸质版,待扫描
学研 常用国語辞典 改訂第5版
学研 現代実用国語辞典

角川 必携国語辞典
已扫描:角川必携国語辞典 扫描图片

学研 現代標準国語辞典 改訂第4版
三省堂 例解新国語辞典 第十一版
** ベネッセ新修国語辞典 第二版**

其他小学词典
学研 新レインボー小学国語辞典 改訂第7版
学研 新レインボー はじめて国語辞典
旺文社 小学国語新辞典
三省堂 例解小学国語辞典
チャレンジ小学国語辞典カラー版
光村教育 小学新国語辞典

類語辞典

目前只有两本有数据,但没有制作为mdx
角川類語新辞典
已制作完成:角川類語新辞典 mdx
日本語シソーラス 類語検索辞典 第2版
已制作完成:日本語シソーラス 類語検索辞典 第2版 mdx

三省堂 新明解類語辞典
数据源:LogoVista
已制作完成:新明解類語辞典 mdx
EasyDict版:新明解類語辞典 EasyDict版

三省堂 類語新辞典
三省堂 必携 類語実用辞典 増補新版
数据源:epwing,官网

三省堂 現代語古語類語辞典
数据源:一太郎
三省堂 反対語対立語辞典
三省堂 類語ニュアンス辞典

小学館 ちがいがわかる類語使い分け辞典
已制作完成:ちがいがわかる 類語使い分け辞典 mdx
小学館 使い方の分かる 類語例解辞典 新装版
数据源:JapanKnowledge
已有数据和mdx,中文整合版待制作
当前版本:重新爬了下 goo上的 小学館 《使い方の分かる 類語例解辞典》,也许是无用功

小学館 例解学習類語辞典 似たことば・仲間のことば
已扫描:小学館 例解学習類語辞典 扫描图片

研究社 類義語使い分け辞典
数据源:LogoVista,epwing
已制作:研究社 類義語使い分け辞典 mdx

講談社 類語辞典
已买到纸质版,待扫描
講談社 類語大辞典
講談社 類語の辞典 上下
講談社 日本類語大辞典
这两个应该是同一本,前面的是后面的再版

角川書店 類語国語辞典

学研 新レインボー 小学類語辞典
有pdf:新レインボー 小学類語辞典(オールカラー) - Anna’s Archive
学研 大きな字の類語辞典

東京堂 類語分類感覚表現辞典
東京堂 類語活用辞典 新装版
東京堂 反対語対照語辞典 新装版
東京堂 表現類語辞典 新装版
有老板pdf,新版似乎只改了封面
已ocr:東京堂 表現類語辞典 ocr文本
東京堂 類語活用辞典 新装版
这本似乎是上一本的缩印版,不太重要
東京堂 類語辞典

創拓社 似た言葉使い分け辞典: 正しい言葉づかいのための
学研 用例でわかる類語辞典 第2版
ぎょうせい 早引き類語連想辞典 第2版
創拓社 類語表現活用辞典

古语词典

古语词典目前有mdx的也很少

旺文社 古語辞典 第十一版
已有mdx:旺文社古語辞典 第十一版

旺文社 図解全訳古語辞典
坛友分享了电子版:旺文社 図解全訳古語辞典[可查词PDF]

大修館書店 新全訳古語辞典
数据源:LogoVista
已制作:大修館 新全訳古語辞典 mdx
大修館書店 古語林
大修館書店 基本古語辞典 新装版

三省堂 詳説古語辞典
三省堂 全訳基本古語辞典
三省堂 新明解古語辞典 第三版
只有第二版pdf
三省堂 例解古語辞典 第三版

小学館 古語大辞典
小学館 全文全訳古語辞典
数据源:JapanKnowledge
小学館 全訳古語例解辞典
学研全訳古語辞典 改訂第二版
目前有第一版mdx

学研学習用例古語辞典 改訂第三版

ベネッセ全訳古語辞典
ベネッセ古語辞典

文英堂 全訳全解古語辞典
東書最新全訳古語辞典

ことわざ、慣用句

其他词典

研究社 日本語コロケーション辞典
数据源:monokakido,LogoVista
已制作:研究社 日本語コロケーション辞典 mdx

研究社 日本語複合動詞活用辞典
制作中

研究社 日本語口語表現辞典
第一版:日本語口語表現辞典 初版(美化版)(2026年3月13日 优化更新)
第二版:研究社 日本語口語表現辞典 第2版 mdx

東京堂 日本語の類義表現辞典 新装版
研究社 日本語類義表現使い分け辞典

三省堂 新明解語源辞典
目前只有纸质版

三省堂 当て字・当て読み 漢字表現辞典
目前只有纸质版

講談社 擬音語・擬態語辞典

講談社 日本語表現大辞典

岩波書店 日本の作家 名表現辞典

新明解日本語アクセント辞典 第2版 新装版
制作中

这本初版有一个文字版的PDF,目前我在根据一个没有结构的mdx的基础上更改,现在只有增加@@@LINK优化搜索体验的工作了

類語辞典还有一个,「類語玉手箱」(有mdx)的新版:
類語玉手箱 | 翻訳家やライター、ウェブ制作者などにオススメの無料日本語類語辞典サイト | 同義語 関連語 シソーラス 対義語

手动插入吗,这工作量够大的,德语有好几本词典也是都有原版的,我现在正在研究一个新工具能结构化插入。

先查查ebwin格式,有的给话可复刻转换,没有再做ocr之类的工作。

查了下这两本是有epwing的:
三省堂 必携類語実用辞典
研究社 類義語使い分け辞典

虽说没有结构,但是有换行标签,再加上每个板块的自身标题什么的这些自带结构信息,所以写的python处理的

这个已经制作了文本版本的mdx,没分享。有pdf

这个一太郎和DONGRI都有

这隔壁已有人制作好mdx,是goo辞書还有时抓取制作的

这个已经制作了文本版本的mdx,没分享。

一版和二版都有mdx,没分享。这个logovista有,一版可以提取数据,但二版不行

三省堂的daily concise上过金山词霸日文版和本家的web dictionary。

学研的几部在两年前上过dongri,早下架了,学研不弄电子出版了。

旺文社古語有在Sharp的brain+,不过很快最新版就要在自家APP了。

講談社類語上过AppStore,早下架了。

小学馆的類語例解上过苹果词典。古語也有在Seiko的学生辞典,不过不可能拿得到权限。

别的都没有电子化,日本辞典xml化基本都digital assist做的(学研和小学馆除外),好奇哪些有电子版可以自己查官网,不过近几年三省堂和logovista开始自己弄了。

编辑上限了,三省堂類語也上过AppStore,不过基本后来的新明解可以取代了。

感谢提供信息,ちがいがわかる類語使い分け辞典这本词典pdf在哪里可以找到呢

原来这些都有过电子版啊,之前没有抓取保留下来很可惜。

这个8800円也太贵了
找到了之前的版本,传一下
類語玉手箱.zip (5.9 MB)

チャレンジ小学国語辞典
本想凑单一起寄,
等着等着就绝版了。

补一本三省堂《新明解故事ことわざ辞典》,收录惯用句、故事成语、格言、名句等各色语汇。

另外商务印书馆引进的二版《日语口语词典》可以考虑合购再扫描转制成pdf文档。之前坛友自行ocr文本化的《明镜日汉词典》可以尝试同最新三版文本进行同词条文本行对齐,个别增补修正之处可以考虑用千问等ai模型逐一进行对译。

俗语惯用语词典也有好多,我都没来得及整理,我查了一下发现日本词典业还真是发达,拟声拟态词和外来语都有好几本词典。

其实作用不大,日国大和各种国语辞典够查了,这里面没收的而这些专门辞典才有的一般碰不到,感觉用这些像掉书袋。拟声拟态主要对日语学习者有用,便于理解。外来语更是鸡肋,不如大辞泉收的全吧(不管科技术语的话)。

可以就现成已有的电子辞书资源进行整合,之前登楼语料库那哥们不是尝试过把各部同类语文词典串起来,可惜只停留在例句层面。如果能建设一个公有语料池,添加经过分词预处理的各种日语文献语料包括日汉互译对齐语料(语料收集渠道可以是安娜图书馆抓取电子书,可以是网友自发贡献的私藏电子书),方便查词时关联到各个实在语境中的句子,那比简单在词典中通过孤立句块(例句)把握词义有效多了。

再想得更远点,从日语词库中抽选出词频较高、覆盖率较大的前50000词,结合这部分词语在NLB、NLT等日语语料库搭配信息、情景例句、书写形式等信息元素,对日语学习的助益绝对很大。

我之前做过一部分工作,不过主要是词汇书和教材文章还有词汇表制作为anki包,比较麻烦的就是音频对齐。我只做完了《万词对策》和《大家的日语中级》,单词例句还有文章都和音频进行了逐句对齐,不过之前是手动处理的应该还是有错,我忙着备考也没时间仔细校对。其实我已经收集了主流教材和单词书的pdf的音频其他的还没整理。分词的话python结构化后直接用mecab很方便,我之前写过分词然后加furigana的脚本。词典现在主流的日汉词典我正在文本化,不过还是要写各种工具。我还在文本化另外几个日汉词典,包括形容词和副词专门的词典和日汉辞海。

从我这个过来人的经验来说,日汉双解词典的数字文本化工作十分艰巨,所得不偿所失。我着手进行ocr转制的俞彭年主编的《现代日汉双解词典》内页正文足有千八百页之多,经历两个校次,每一百页用时约三个半小时到四个半小时,饶是如此也还有进一步打磨空间。而你想要文本化的任一本双语词典,体量都比俞书来的大,而且内文词条所涉辞书编纂符号也更繁杂,还有词句夹标注音假名识读写录也是一大难题,估计一本下来就得耗费一百多个小时。你只有真正着手去做,才会真正体会到“言易行难”:sweat_smile: