python爬虫BeautifulSoup的简单使用

 时间:2024-10-12 16:05:44

1、点击开始--运行,输入cmd命令,打开windows命令行窗口

python爬虫BeautifulSoup的简单使用

2、使用pip安装BeautifulSoup包pip install BS4

python爬虫BeautifulSoup的简单使用

3、打开python开发工具IDLE,新建‘bstest.py’文件,并代码如下:from bs4 import BeautifulSoupimport urllib.requests = urllib.request.urlopen('http://www.baidu.com')print (type(s.read()))

python爬虫BeautifulSoup的简单使用

4、F5运行代码,打印出返回结果类型,为bytes

python爬虫BeautifulSoup的简单使用

5、修改代码,将响应传入创建一个BeautifulSoup对象,这样就可以解析了,注意不要使用read方法,代码剧安颌儿如下:from bs4 import BeautifulSoupimport urllib.requests = urllib.request.urlopen('http://www.baidu.com')so = BeautifulSoup(s,'html.parser')

python爬虫BeautifulSoup的简单使用

6、使用创建的BeautifulSoup对象打印网页的title,代码如下:from bs4 import BeautifulSoupimport urllib.requests = urllib.request.urlopen('http://www.baidu.com')so = BeautifulSoup(s,'html.parser')print (so.title)

python爬虫BeautifulSoup的简单使用

7、F5运行代码打印出网页的title,正确解码成中文,这就是beautifulsoup的魅力

python爬虫BeautifulSoup的简单使用
  • 如何设置el-pagination设置上一页箭头为文字
  • 如何遍历Map集合
  • C# 判断IP是否正确合法并给出提示
  • 有道云笔记1.5正式版基本操作方法
  • 如何正确分析网站
  • 热门搜索
    如何给路由器设置密码 不持有的生活 发生火灾时如何逃生 生活系神豪 志愿怎么填报 伪万能的家教生活 试客联盟怎么玩 如何消除疤痕 如何删除cookie 法图麦是什么意思