博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
笔记bs,信息
阅读量:6576 次
发布时间:2019-06-24

本文共 1138 字,大约阅读时间需要 3 分钟。

Beautiful Soup

  • 标签树的下行遍历
属性 说明
.contents 子节点的列表,将<tag>所有的子节点存入列表
.children 子节点的迭代类型,与.contents类似,用于循环遍历儿子节点
.descendants 子孙节点的迭代类型,包含所有子节点,用于循环遍历儿子节点
  • 标签树的上行遍历
属性 说明
.parent 节点的父亲标签
.parents 节点先辈标签的迭代类型,用于循环遍历先辈节点
  • 标签树的平行遍历
属性 说明
.next_sibling 返回按照HTML文本顺序的下一个平行节点标签
.previous_sibling 返回按照HTML文本顺序的上一个平行节点标签
.next_siblings 迭代类型,返回按照HTML文本顺序的后续所有的平行节点标签
.previous_siblings 迭代类型,返回按照HTML文本顺序的前序所有的平行节点标签

prettify() #美化

信息

  • 信息标记的三种形式
  1. XML:eXtensible Markup Language
  2. JSON:Javascript Object Notation
  3. YAML:YAML Ain't Markup Language
  • .find_all(name, attrs, recursive, string,**kwargs) #返回一个列表类型,存储查找的结果

name: 对标签名称的检索字符串

attrs: 对标签属性值得检索字符串,可标注属性检索
recursive: 是否对子孙全部检索,默认为True string: <>...</>中的字符串区域检索字符串

  • 扩展
方法 说明
<>.find() 搜索且返回一个结果,字符串类型,同.find_all()参数
<>.find_parents() 在先辈节点中搜索,返回列表类型,同.find_all()参数
<>.find_parent() 在先辈节点中返回一个结果,字符串类型,同.find_all()参数
<>.find_next_siblings() 在后续的平行节点中搜索,返回列表类型,同.find_all()参数
<>.find_next_sibling() 在后续平行节点中返回一个结果,字符串类型,同.find_all()参数
<>.find_previous_siblings() 在前序的平行节点中搜索,返回列表类型,同.find_all()参数
<>.find_previous_sibling() 在前序平行节点中返回一个结果,字符串类型,同.find_all()参数

转载于:https://juejin.im/post/5c98d1ae518825157c2a96f6

你可能感兴趣的文章
从100PV到1亿级PV站点架构演变
查看>>
Windows 7 x64环境下JDK8安装过程
查看>>
Intent调用系统拍照程序,返回图片太小的问题
查看>>
FineUIMvc v1.4.0 发布了(ASP.NET MVC控件库)!
查看>>
会动的Tabbar
查看>>
完全卸载VS2013的方法
查看>>
十分钟学会Charles抓包(iOS的http/https请求)
查看>>
zoj2676 Network Wars(0-1分数规划,最大流模板)
查看>>
存储器的保护(三)——《x86汇编语言:从实模式到保护模式》读书笔记20
查看>>
Datatables js 复杂表头 合并单元格
查看>>
互联网科普贴-阿里巴巴国际站是什么
查看>>
Live555研究之中的一个 源码编译
查看>>
cocos2d JS-(JavaScript) cc.each循环遍历对象
查看>>
PDF如何自动滚动阅读
查看>>
leetcode ----Trie/stack专题
查看>>
label文字居中
查看>>
在SpringMVC中使用Jackson并格式化时间
查看>>
lk进kernel
查看>>
Android开发之监听发出的短信
查看>>
Android调用系统自带的文件管理器进行文件选择
查看>>