叕更新:國語辭典簡編本,辨析字頭,歷史詞頭,重編國語第四版166024詞頭,教育部詞典一網打盡2025

更新好了,
重編更新到最新的0923,
成語典更新到0924,
國語辭典簡編本的附錄也擼了( 國語辭典簡編本顯示更新到0925但是404無法下載),
WFG的也一波更新了,
文件夾也分好了,直接起飛 :clap:


另外收集重編或者簡編表格,查找是否有缺失的詞條

老大,太厉害了~

意外挖到最美《本草纲目》,最美《说文解字》。感谢楼主!
排版甚合吾意。:grin::grin::grin::grin:

之前下的x86版本,改用64位版本没问题了呵呵完美完美,观察几天看看,一直开着也没无故退出,可以可以

想补一个第四版的,搞不定,我本想过一遍,ID=1&ver=4一直到ID=155074&ver=4,但是直接输入网址,它会跳转回ID=155074,第四版有辨析


如果有历史版本的表格请联系我,缺失的词条我将单领出来,如果没有的话我就照Yuki大佬保留的表格能补多少是多少了

现在是第几版?我记得以前的有辨析,至于表格还有没有不好说,找找看。

现在网站显示的是第6版,然后网站附录也可以查第4版,
辨析的话,据wfg统计好像也就100多组字头,
把每一期表格的词头字头加起来,然后减去最新的0923,大概有4000个,去掉1000个图片字,大概有2000多个词语,例如"點點點"

有空找找,电脑都换了几个,旧数据有些已经死了

dict_revised_2015_20201007.zip
是不是这?

1 个赞

只是加了个自动重定向(referer不为第四版搜索页时),怎么爬不了了?还是能获取到结果的。

curl --ssl-no-revoke "https://dict.revised.moe.edu.tw/dictView.jsp?ID=52890&ver=4"

对对对,是这种格式, Dict开头,dict_revised_是重编。
dict_concised_是简编
idioms是成语
mini是小字典
除了小字典不要,其他都要
简编并不是简单的为重编的子集,也是值得收集的

1 个赞

你是优秀的Python专家,精通于网页爬取,请在理解并解析以下文字之后,优化代码,最后给我正确完整的代码
1,只是加了个自动重定向(referer不为第四版搜索页时)…
2,
import os
import csv
import asyncio
import aiohttp
import aiofiles
import time
import tkinter as tk
from tkinter import filedialog, ttk, messagebox, scrolledtext

有戏, :clap:嘿嘿,果然大佬一句话醍醐灌顶,提纲挈领

看不见啊,跳转自己的网盘了

没内容,空的。。。

多日不用,忘了用法。已更新。

第四版也搞定了,正反“鬱挹”

2 个赞

停不了了,谢谢!!!