大侠们能否将这两个网站爬下来,做成mdx,以便离线查询电影资料?
主要是几个字段:
imdb编号或豆瓣编号、评分、片名、年份、简介……之类,至于海报图片,可有可无。
imdb的链接格式是固定的,如下:
https://w w w.i m d b.c o m/t i t l e/t t 0000001/
https://w w w.i m d b.c o m/t i t l e/t t 0000002/
https://w w w.i m d b.c o m/t i t l e/t t 0000003/
……
https://w w w.i m d b.c o m/t i t l e/t t 11626108/
豆瓣电影的链接类似这样子:
https://m o v i e.d o u b a n.c o m/s u b j e c t/1433702/
https://m o v i e.d o u b a n.c o m/s u b j e c t/35215390/
不过我猜不到它的编号逻辑和最小值是多少。
大侠们看看,有搞头不?
我不懂python,总以为只是十几行代码的事儿。
不知猜错了没有?
谢谢!