Beautiful Soup库
具有解析,遍历,维护“标签树”的功能的功能库
1 | from bs4 import BeautifulSoup |
五种基本元素
tag, name, attributes, navigableString, comment
1 | tag.标签名 # 得到标签 |
非find的常用方法
1 | soup.title |
标签树
标签树的下行遍历
1 | tag.contents # 得到子节点列表 |
标签树的上行遍历
1 | tag.parent # 父亲标签 |
标签树的平行遍历
1 | tag.next_sibling # 下一个平行节点 |
使soup更加规则
1 | soup.prettify() |
find_all()
1 | # 接口 |
1 | # 用正则表达式匹配符合对应名字的标签名 |