设想了一个网络词典抓取模块的界面

设想了一个网络词典抓取模块的界面

Spidering

O By a seedword URL: […]
O By a numbered URL: […]
O By a TOC URL: […]
O By a URL list (file): […]

Extracting
Keyword (XPath): […]
Contents (XPath): […]
CSS (XPath): […]

Output
Filename: […]


(应该不会有人认为这和展示词典但不提供下载一样是擦边球广告吧?)

1 个赞

下面有请本论坛著名空想家 surfactant 给大家带来本期内容

孩子,用大辞泉搜一下“架空”这个词

spidering Web scraping

デジタル大辞泉

… see more
デジタル大辞泉
か‐くう【架空】
アクセント かくう○
〘名・形動〙
1空中に架け渡すこと。「―ケーブル」
2根拠のないこと。また、事実に基づかず、想像によってつくりあげること。また、そのさま。「―の人物」「そんな―な事を宛にして心配するとは」〈二葉亭・浮雲〉
類語 想像・推測・臆測おくそく・仮想・想見・空想・夢想・幻想・連想・妄想・幻覚・拵こしらえ事・作り事・空事・絵空事・でっちあげ・イマジネーション・ファンタジー・イリュージョン

我給樓主一個切實可行的建議。

把CC-CEDICT數據製成mdx的程式是有用的。

Quantus已經寫好了python腳本:

CC-CEDICT製作mdx自助

你不是在推薦python界面的網站嗎?就給Quantus的程式做個界面,編譯一下,讓新手都能方便地使用。

但是我建議你先把你對西北風說的那句話收回來:「我寫C++時你還在念小學」,而且應該道歉。

(我好奇:你用C++寫了什麼啊?Hello World?)

西北風已經承諾:假如你寫程式,他可以幫你批。你道歉後,就誠懇地請他指點這個小項目吧。

你的程式可能會被批得一塌糊塗,但是技術不過硬就別說硬話了,服軟吧,好好學習。

人都要面子,你放不上面子公開道歉,就發個私信道歉吧。

這個小之又小的項目聽起來不酷,但是你如果能完成,也算做完了一個項目,不再是空想家了。

持續再發這種帖子,對論壇有害無益,對你自己更是壞處多多。

大家可以假裝看不見你的帖子,那真地對你好嗎?

旁白:

我知道有心腸好的人想鼓勵樓主,但我真心說:別鼓勵他了。你們真認為讓他這樣過下去好嗎?

热心坛友分享过的python抓取实例
@舒服员 https://forum.freemdict.com/t/topic/16152
@atauzki https://forum.freemdict.com/t/topic/16120/2
@lurker https://forum.freemdict.com/t/topic/6428/44

什么时候你也分享一个自己写的啊,等别人学会了给你充当免费劳动力?

1 个赞

@hua 站长你好,特向你说明一下,我的发言如果不符合你的论坛理念,封号我没意见。

但是,如果因为有人在下面固定地吐痰、吐口香糖或发表不符论坛规则的言论,大部分我是拉黑看不见的,除了有些为吐痰而注册的匿名新账号,希望你不会因此把我的帖子一起扔进垃圾堆。

谢谢。

几位喜欢吵架的浪费了我太多时间,请去别的地方吧。

楼主可以务实一些。我可没强迫你怎么样,上句话就像 @匿名1403 说的一样,我是从网友角度出发的。

好吧,算是劝退,论坛有论坛的理念。在此学到过许多东西,向站长和各位有所指教的坛友表示感谢!

我觉得hua是以网友身份给你提了一个建议,而非用站长身份来强迫你必须怎样。

很多人都希望你务实一些。毫无营养的做梦帖、口水帖你至少发了十几个了吧,没看到对论坛、对网友有什么益处。

小庙容不下surfactant这尊大佛,我看你不如去隔壁讨论一阵子,隔壁可是有40万的注册用户。

楼主有那么多的高精尖的前瞻的想法和技术,其实可以去腾讯阿里百度这些大厂,更能大显身手,
至少也应该那些编程大神云集的IT论坛去展现你的那些新思维新技术

在这里,大家一般是制作一些词典,分享一些资料,
你发的那些帖子,其实是外行看不懂,内行看笑话

很好的建议 +1