1.1 BeautifulSoup简单介绍
更为详细的教程建议看崔庆才得博客https://cuiqingcai.com/1319.html
BeautifulSoup
安装
1 | pip install bs4 |
引入
from bs4 import BeautifulSoup
加载网页
1 | # 1. 本地 |
数据解析方法和属性
标签定位
1
2
3
4
5
6soup.a # 定位的是第一次出现的tagName标签
soup.find('div') # 第一个div 等同于 soup.div
soup.find('div', class_='test') # 属性带个下划线 _
soup.find_all('div') # 返回匹配要求的所有的标签 列表
soup.select('.test') # css选择器, 返回的是列表
soup.select('.test>ul>li') # li[1] 不支持索引,只能返回结果之后再选择列表文本数据
1
2
3soup.a.text
soup.a.string
soup.a.get_text()string 只能获取直系文本内容
text/get_text() 可以获取所有子文本标签属性
1
2soup.a['href']
soup.div['class']
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 梧桐的学习日记!





