求抓 - 一个更好的说文解字版本

http://www.shuowen.net/jiezi/4E16/

基本解释与WFG版本的说文应该相同,亮点是增加了字形演变、白话版和解说版的注释,无疑更大发挥了说文的价值。

WFG的版本已经很好了,希望有大佬出手打造一个更强的版本。

1 个赞

看了一下,却是很全

2 个赞

这网站是国学大师做的

这个应该没啥难度,直接get字头的u码。手头没有《说文解字》的字头,要不一会儿就抓完了。

@sxingbai

我在这里连这个网站也上不了。

我不是研究这个的,不过因为把《说文解字注》导入了Access资料库,手头倒是有《说文解字》的字头。

不知道对各位是否有用,上载于此,聊供参考。

shuowen.rar (60.8 KB)

少实斋

多虚不如少实

多谢!已经回家了。机器跑着无聊,看了一下您的字头,竟然有10693个,而我用的好像是wfg的只有9967个。

合并完善了一下shaoshi給的字頭,部份可能網站查不到,不過很少會有遺漏的情況了。

shuowen.tar.gz (41.2 KB)

跑完了,再试试其它多出来的看能不能抓到。不过之前我已经看了,有些是异体字,抓了也没什么实际的东西,比如“ 𧰧”。

1 个赞

這麼快,看來真的沒啥難度啊 :wink:

还没呢,我在每个页面加个几秒延时。刚才是想说跑完了之后 :sweat_smile:
试了少实兄提供的字头,有一些是部件或扩展区的异体字,网站都显示“ 本站只能查找《说文》里面的汉字,其他字词本站查不到”。
查网上的说法,大多是9353个字,也有说9345的。wfg的9967应该够了。

忽然想到:段玉裁好像加了一些《说文解字》没收的字(应该在最后面),所以《说文解字注》的字比较多。

我只是导入了文本,没校对过字头,也许有私用区字。

Wfg多出来的字头,也许是mdict的跳转。假如只要准确的字头,必须把跳转筛除。

我没用跳转的字头,加上跳转的肯定更多。

怪自己加了延时,七千多条跑了十几个小时。等得着急,取消延时,余下的二千多条十几分跑完,真是蠢死。
先把文本传上,需要的先整理着,稍后上传图片。
shuowenx.7z (6.2 MB)
shuowenx.css (11.7 KB)
阿里云犯神经,压缩包也不让分享,改为图片也不行。上传图片比下载还慢,能自己下载的自己下载吧。图片是相对路径的前面加上http://www.shuowen.net就行了。
终于上传到奶牛了,现在好像只有20次免费下载机会:
你有一份文件待查收!即刻点击链接获取文件:https://cowtransfer.com/s/d7e9ef5250a14a 或进入 cowtransfer.com 获取,在首页输入取件码:652385(24 小时内有效)

4 个赞

神一样的大佬,辛苦了


:sweat:

用ctrl+G查找一下字节位置,看什么问题

希望有大神做成可用的词典……

词头太长吧?看看下面这个帖子:

mdxbuilder 問題怎麼解

我已经做好了,但跳转遇到了问题

Done!
Original index size = 0KB, compressed size = 0KB, compression ratio = 355%
Time used for this section: 0 seconds
Begin processing data contents…
Failed to read from source file:C:\Users\NTU\Downloads\shuowenx\shuowenx.txt for record(line):1
Conversion failed!
还是不行……