本文共 1138 字,大约阅读时间需要 3 分钟。
Beautiful Soup
属性 | 说明 |
.contents | 子节点的列表,将<tag>所有的子节点存入列表 |
.children | 子节点的迭代类型,与.contents类似,用于循环遍历儿子节点 |
.descendants | 子孙节点的迭代类型,包含所有子节点,用于循环遍历儿子节点 |
属性 | 说明 |
.parent | 节点的父亲标签 |
.parents | 节点先辈标签的迭代类型,用于循环遍历先辈节点 |
属性 | 说明 |
.next_sibling | 返回按照HTML文本顺序的下一个平行节点标签 |
.previous_sibling | 返回按照HTML文本顺序的上一个平行节点标签 |
.next_siblings | 迭代类型,返回按照HTML文本顺序的后续所有的平行节点标签 |
.previous_siblings | 迭代类型,返回按照HTML文本顺序的前序所有的平行节点标签 |
prettify() #美化
信息
- XML:eXtensible Markup Language
- JSON:Javascript Object Notation
- YAML:YAML Ain't Markup Language
- .find_all(name, attrs, recursive, string,**kwargs) #返回一个列表类型,存储查找的结果
name: 对标签名称的检索字符串
attrs: 对标签属性值得检索字符串,可标注属性检索
recursive: 是否对子孙全部检索,默认为True string: <>...</>中的字符串区域检索字符串
方法 | 说明 |
<>.find() | 搜索且返回一个结果,字符串类型,同.find_all()参数 |
<>.find_parents() | 在先辈节点中搜索,返回列表类型,同.find_all()参数 |
<>.find_parent() | 在先辈节点中返回一个结果,字符串类型,同.find_all()参数 |
<>.find_next_siblings() | 在后续的平行节点中搜索,返回列表类型,同.find_all()参数 |
<>.find_next_sibling() | 在后续平行节点中返回一个结果,字符串类型,同.find_all()参数 |
<>.find_previous_siblings() | 在前序的平行节点中搜索,返回列表类型,同.find_all()参数 |
<>.find_previous_sibling() | 在前序平行节点中返回一个结果,字符串类型,同.find_all()参数 |
转载于:https://juejin.im/post/5c98d1ae518825157c2a96f6