文章目录[x]
- 1:urllib.request
- 2:selenium
- 3:re正则表达式
- 4:lxml
- 5:beautifulsoup
学习爬虫,第一步就是安装环境,一起来看一看吧。
参考链接CSDN
urllib.request
测试状态,需要输入:
import urllib
import urllib.request
response=urllib.request.urlopen("http://www.baidu.com")
print(response)
返回结果为HTTPResponse的对象: <http.client.HTTPResponse object at 0x000001929C7525F8>
selenium
re正则表达式
lxml
beautifulsoup
cmd中输入pip install 对应名字安装。