Python BeautifulSoup 指南

BeautifulSoup 是一个处理 HTML 和 XML 的 Python 第三方库。

👉 所有文章
BeautifulSoup 简介 BeautifulSoup 安装 根据 HTML 标签名获取元素 根据 class 获取元素 根据 id 获取元素 使用 get_text 获取 HTML 标签文本内容 使用 attrs 处理 HTML 标签属性 使用 decode_contents 获取 HTML 标签嵌套的 HTML 内容 嵌套获取元素 使用 find 和 find_all 查找元素 使用 select_one 和 select 查找元素 使用 append 追加内容 使用 insert 插入内容 使用 clear 清空内容 设置内容 使用 string 获取和设置 HTML 标签内容 使用 extract 删除 HTML 标签 使用 prettify 格式化 HTML 获取前后的同级元素 使用 find_previous、find_next 获取当前元素前后的元素 使用 find_parent 获取父元素 使用 wrap 为元素增加父元素
实战: 去除 HTML 中的注释 实战: 去除 HTML 中的 script 实战: 解析 oschina 首页内容 实战: 解析微信公众号文章列表 实战: 替换 href 属性内容

🌴 键盘双击 xx ,可以快速查看所有文章列表。

Python BeautifulSoup 指南


基础

实战


( 本文完 )

文章目录