python爬虫数据分析
beautifulsoup
from bs4 import BeautifulSoup |
标签及其内容;拿到它所找到的第一个内容
print(bs.title) |
只要内容不要标签
print(bs.title.string) |
bs.a.attrs 获取a标签的所有的属性,返回一个字典 |
3.Beautifulsoup 表示整个文档
print(bs.attrs) |
遍历
正则
bs.find_all(re.conpile("a")) |
find_all()
t_list=bs.find_all("a") |
CSS选择器
print(bs.select('title')) 通过标签查找 |
python爬虫数据分析