有些数据找不到,那就自己抓吧。Python提供了一些网页爬虫工具框架,既可以爬取数据,也可以获取、清洗数据。

Scrapy

http://scrapy.org/

Beautiful Soup

http://www.crummy.com/software/BeautifulSoup/

Python-Goose

https://github.com/grangier/python-goose