更新好了,
重編更新到最新的0923,
成語典更新到0924,
國語辭典簡編本的附錄也擼了( 國語辭典簡編本顯示更新到0925但是404無法下載),
WFG的也一波更新了,
文件夾也分好了,直接起飛 ![]()
想补一个第四版的,搞不定,我本想过一遍,ID=1&ver=4一直到ID=155074&ver=4,但是直接输入网址,它会跳转回ID=155074,第四版有辨析
如果有历史版本的表格请联系我,缺失的词条我将单领出来,如果没有的话我就照Yuki大佬保留的表格能补多少是多少了
现在是第几版?我记得以前的有辨析,至于表格还有没有不好说,找找看。
现在网站显示的是第6版,然后网站附录也可以查第4版,
辨析的话,据wfg统计好像也就100多组字头,
把每一期表格的词头字头加起来,然后减去最新的0923,大概有4000个,去掉1000个图片字,大概有2000多个词语,例如"點點點"
有空找找,电脑都换了几个,旧数据有些已经死了
dict_revised_2015_20201007.zip
是不是这?
只是加了个自动重定向(referer不为第四版搜索页时),怎么爬不了了?还是能获取到结果的。
curl --ssl-no-revoke "https://dict.revised.moe.edu.tw/dictView.jsp?ID=52890&ver=4"
对对对,是这种格式, Dict开头,dict_revised_是重编。
dict_concised_是简编
idioms是成语
mini是小字典
除了小字典不要,其他都要
简编并不是简单的为重编的子集,也是值得收集的
你是优秀的Python专家,精通于网页爬取,请在理解并解析以下文字之后,优化代码,最后给我正确完整的代码
1,只是加了个自动重定向(referer不为第四版搜索页时)…
2,
import os
import csv
import asyncio
import aiohttp
import aiofiles
import time
import tkinter as tk
from tkinter import filedialog, ttk, messagebox, scrolledtext
看不见啊,跳转自己的网盘了
没内容,空的。。。
多日不用,忘了用法。已更新。
停不了了,谢谢!!!









