日本大百科全書(ニッポニカ) [220915]

所有内容来源于kotobank.jp, 数据更新截止2022年9月15日,总共约122000词条。感谢kotobank宽松的反爬机制:




使用IDM爬取网页手动制作,可能遗漏了个位数的词条。本人基本不懂html和css,只会很少一点正则表达式,照猫画虎地把辅助查询和跳转的词条弄全了,但仍存在三个显著问题:

  1. 没有美观的文字格式

  2. 没有实现页内的图片跳转

  3. 没有图片大小自适应

若有熟悉css语法的朋友有心修改则感激不尽

https://cloud.freemdict.com/index.php/s/TNX4RwcsYF4PXms
(如无意外,不会更新数据,请勿要求更新)

27 个赞

楼主您是我的神!

感谢您的制作和分享!

2 个赞

此言差矣。若是说现代世界的工作中python等脚本语言对于自动化和提升效率必不可少,那还情有可原,但是说没有html/css/js就寸步难行则是言过其实。这三个如果不是长期接触网页前端和辞典制作的人士估计听都没听说过。在现在坛内辞典丰富多彩的情况下,还是应该多花时间认真阅读书籍、利用好辞典才是。

2 个赞

楼主制作辛苦了 :+1:
下载后放到DictTango看了2天,感觉又是一个不错泛读的材料 :smile:
另外,如果寒假有空,我可能会尝试优化一下排版。Flag先立起,万一实现了呢尽量不鸽233

4 个赞

How can i solve this overflow problem?
There’s no .css file
imagen

3 个赞

It came at first without css file because I don’t know about css. Learn to decorate if needed

2 个赞

我下载才30k/s,3G得下多久啊。。。
哪位能传个阿里云盘啊。。。

感谢楼主的辛苦制作!
但发现了一个问题——您似乎是想把原格式括号“()”里的假名处理为上标“SUP”,但实际造成了许多误伤。
比如把公式符号 f(x)
变成了 fx
见【写像】中的各公式;
也没有考虑到有多重括号的情况,造成各种不匹配,如【ビシュヌ】中的
(梵天ぼんてん)
人獅子しし)(ヌリシンハ

又由于原来文本中本就存在上标,所以若简单把上标还原为括号又会造成误伤。只能希望您保留有未被此转换污染的文本了。

3 个赞

https://www.123pan.com/s/iGz0Vv-WjvVh

1 个赞

原文本我没存。试试用正则表达式<sup>([^ぁ-んァ-ン]+?)</sup>替换一下

1 个赞

mdd好大 能否压缩图片

2 个赞

谢谢~~~~~~~~~~~

1 个赞

谢谢步兄
不然真下不动

123盘几分钟就下好了

1 个赞

支持大佬
加油

2 个赞

I found a lot of errors in the handling of synonyms that made a lot of words unsearchable so I completely redid all headwords/synonyms.

This results in a smaller number entries but in actuality greatly improves the number of searchable entries and their accuracy.

I have also re-processed the mdx to now include a css file! (feel free to edit it if you do not like my included compact css style).

The mdd and png icon are unchanged, please download them from the first post and rename them.

A few examples:

チメドリ
ちめどり / 知目鳥
babbler

Can now be searched as either:
“チメドリ”, “ちめどり”, “知目鳥” or “babbler”
instead of:
“チメドリ”, “ちめどり / 知目鳥” or “babbler”
Notice how the old version is unable to match “ちめどり” or “知目鳥” because entries were not processed correctly.

Other examples:

シオヤムシヒキ
しおやむしひき / 塩屋虫引虻
[学] Promachus yesonicus

Can now also be searched as “Promachus yesonicus” among other fixes.

And many more fixes including the removing of html tags in headers/synonyms, replacement of gaiji to unicode, …

10 个赞

Thank you for your corrections, the searching becomes more convenient and flexible now.

2 个赞

楼主,资源过期了,可以补发吗