我也不太会今ㄦ个看了看它的android app,底子照着海词词典app改的,因为一堆资源文件都没删。但是App被360加壳了。我不懂安卓逆向,不知道怎么处理。
所有手语图片格式我看了下ㄦ,大概是这样
http://img.haidii.com/image/41001/
国家通用手语图床/7d1d984f/
手语图示或者/8b8fd305/
视频浏览图/fc14753bf/
类似形式的9位十六进制数,我猜测是根据词条id生成的某种编码。/f53fa3dad1744e86c3c46364bd3b528b.png
类似形式的32位16进制数,我猜测是根据词条id生成的md5编码。
目标是爬下来所有图片、文字(视频我还没想好怎么办),现在有这么两个法子。
- 写按键脚本,挨个ㄦ点,抓取文字,获得图片响应,记录GET的URL,从而得到图片。反正不到一万条词条,一张图片也就几十K,10秒抓取一个词条,30个小时就可以得到全部内容,服务器流量也就300MB,也属于正常访问流量范围内。
- 安卓逆向。进展会比较缓慢。
我目前打算是按照第一个方案继续做下去。