网站程序问题,只能等后续更新了。
之前小草大侠把这一整套书做成了mdx,上传如下,供楼主参考,看能否在此基础上进一步优化。目前发现能查到作者名字比如“李白”,但只能查到部分作品名称,查不到“古风(其一)”/“古风其一”等作品名:
我是说小草做的版本查不到“古风(其一)”/“古风其一”等
大概是因为他没有拆原文诗句出来做词头吧。我的是经过整理然后再拆分诗句来做的词头
不知好不好在他的基础上整理,他的是全套词典
50k的下载速度饶了我吧,你可以下载来看看有什么不同,如果只是把原文放进去而没有加一些方便查得的索引,那跟看书没两样了
从原书抓取数据转换而来的话,很难说有没有遗漏或者删减,所以最好不要直接在原来的成品基础上改造
又传了一份到这里,这个应该速度可以。您可以对比看看:
https://wormhole.app/vnBQM#BEhRQpHYSmdwhkLV6p2v7g
如果只用这一本,或许这样也可以,但我想很多人跟我一样,用GD一次是查好多本,而几乎所有辞典都是只用「诗名」来查,因此目前这本辞典的索引会让使用者需要多查一次,因为这本辞典和其他辞典加起来,相当于两个条目。如:
如果改成「望岳」就可以查到,那就只要查一次即可(因为和其他辞典的引索引一样)。当然,如果某题名是很多诗都采用,有可能使查詢結果的頁面變得冗長,是其缺点,但我想这样情况应该不会太多,整体而言还是利大于弊的,您可考虑看看。
因为索引里面还有通过诗句反查诗的,如果按你那样的话,反查会出来多个同名结果造成一个结果变得太长看起来就很费劲了,并没有让人专注于想要的结果。不过你要一份没有按作者区分的话也是有的。
poetry1.mdx (2.3 MB)
感谢楼主分享,完全达到当初设想的效果了,
我一直想自己土法炼钢搞出来的,鸽了,主要是纯人工复制粘贴的话就一点技术含量都没有,所以没有动力,楼主有空的话可以讲解一下这本epub到mdx,以及css的制作过程吗,四舍五入就当自己制作了
涉及到太多东西了,如果真要做的话,必须得会python和正则表达式以及html和css的知识,会这些了就不是问题。我分享电子书生成的脚本吧(水平有限欢迎大佬指正),仅适用这本词典,如果有相关的知识的话其他词典也应该可以根据修改来生成。
请问这个有mdd吗?压缩档里面没看到。谢谢!
这本没有图片,所以没有mdd
感谢制作,请问py脚本在哪下载
py脚本已经没什么参考意义了。因为这本辞典包含的书籍由多人编撰,有各种样式问题和漏缺,是需要进行一定的加工排错然后再运行脚本,其中可能还会出现一些错漏需要进行修正。你想制作自己的辞典,可以看beautifulsoup的教程。
就是基于那个辞典搞的,正文太多错误了,各种乱码和缺字、随意排版。已经放弃后续制作了 ,除非有人校对原文。黑方块和白方框可以用程序查出来哪个文件缺失,但是乱码就不能确定了,因为乱码系统也会觉得是正常的文字只是对人类来说是乱码。