程序似乎没读取font.fmd,然后其他的dat就是按顺序存储的字符图像,写了个程序处理这个图片,得到字体图像。
ascii28.dat是半角字体,对应JIS0201编码范围,外字Extcode从A121开始
jis28.dat是全角字体,对应JIS0208编码范围,外字Extcode从B121开始
复用了之前的字体校对工具,做了更改:
有些奇怪符号替换为了公式:
这个版本外字很少,在about页面看到了这个说明:
TVware 情報革命シリーズ 日本語大辞典』に収録した語彙[ごい]は、それぞれこの凡例に説明する内容が順に記述されています。(TVware版では、JIS外漢字は一部を除き仮名に置き換えてあります)
※検索方法の詳しい内容は、添付の解説書をご参照ください。
所有html文件转为了html编码然后去掉了外字
converted_html.zip (16.6 MB)
mdx和文本txt版都已做好,图片和链接都可以用。
日本语大词典
链接: 百度网盘 请输入提取码 提取码: 1234
json数据和生成脚本也一并提供
NihongoDaijiten.zip (19.9 MB)
Beautiful work, thank you so much!
I have fixed 4 entries where the html was broken beyond entry ⑳. (取る for instance)
I have also combined sub entries into their main entries and made the reading searchable for instance 兎死すれば狐是を悲しむ can now also be searched as うさぎしすればきつねこれをかなしむ.
感谢,现在epwing格式新工具我正在改进,准备处理一下新明解外字问题然后开始制作双语版,然后学研那本我也准备制作。