转载

发表于 2014年12月14日
浏览 (1,926)
评论 (0)

解析一个body片断_jsoup教程

问题

假如你有一个HTML片断 (比如. 一个 div 包含一对 p 标签; 一个不完整的HTML文档) 想对它进行解析。这个HTML片断可以是用户提交的一条评论或在一个CMS页面中编辑body部分。

办法

使用Jsoup.parseBodyFragment(String html)方法. String html = "<div><p>Lorem ipsum.</p>";Document doc = Jsoup.parseBodyFragment(html);Element body = doc.body();

说明

parseBodyFragment 方法创建一个空壳的文档，并插入解析过的HTML到body元素中。假如你使用正常的 Jsoup.parse(String html) 方法，通常你也可以得到相同的结果，但是明确将用户输入作为 body片段处理，以确保用户所提供的任何糟糕的HTML都将被解析成body元素。Document.body() 方法能够取得文档body元素的所有子元素，与 doc.getElementsByTag("body")相同。

保证安全Stay safe

假如你可以让用户输入HTML内容，那么要小心避免跨站脚本攻击。利用基于 Whitelist 的清除器和 clean(String bodyHtml, Whitelist whitelist)方法来清除用户输入的恶意内容。

正文到此结束

所属分类： jsoup

本文标签： parseBodyFragment jsoup
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,768) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,109) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(11,923) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,823) 评论(0)
Decorators in ES7

浏览(16,442) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,410) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(12,865) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,788) 评论(0)
【开班了】JAVA培训班正式招生

浏览(7,918) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,083) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG