转载

发表于 2014年12月14日
浏览 (1,479)
评论 (0)

使用DOM方法来遍历一个文档_jsoup教程

问题

你有一个HTML文档要从中提取数据，并了解这个HTML文档的结构。

方法

将HTML解析成一个Document之后，就可以使用类似于DOM的方法进行操作。示例代码：

File input = new File("/tmp/input.html");Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/"); Element content = doc.getElementById("content");Elements links = content.getElementsByTag("a");for (Element link : links) { String linkHref = link.attr("href"); String linkText = link.text();}

说明

Elements这个对象提供了一系列类似于DOM的方法来查找元素，抽取并处理其中的数据。具体如下：

查找元素

getElementById(String id)
getElementsByTag(String tag)
getElementsByClass(String className)
getElementsByAttribute(String key) (and related methods)
Element siblings: siblingElements(), firstElementSibling(), lastElementSibling(); nextElementSibling(), previousElementSibling()
Graph: parent(), children(), child(int index)

元素数据

attr(String key)获取属性attr(String key, String value)设置属性
attributes()获取所有属性
id(), className() and classNames()
text()获取文本内容text(String value) 设置文本内容
html()获取元素内HTMLhtml(String value)设置元素内的HTML内容
outerHtml()获取元素外HTML内容
data()获取数据内容（例如：script和style标签)
tag() and tagName()

操作HTML和文本

正文到此结束

所属分类： jsoup

本文标签： DOM jsoup
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

配置虚拟站点

浏览(10,025) 评论(20)
修改上传文件权限

浏览(11,457) 评论(18)
VPS 自我监控

浏览(10,249) 评论(23)
OpenVZ VPS 额外支持

浏览(10,329) 评论(17)
openfire数据库安装指南

浏览(19,825) 评论(0)
openfire协议支持指南

浏览(9,256) 评论(18)
openfire定制指南

浏览(11,370) 评论(17)
Caffe 深度学习框架上手教程

浏览(15,569) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(16,360) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(16,205) 评论(0)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG