应用介绍
同类应用
下载地址
应用介绍
这款htmlparser.jar绿色版它是一个java研发项目研发的htmlparser.jar包,主要可用于改造或提取html,合理的使用htmlparser框架可以让你的工作更加顺畅。欢迎大家下载使用。
基本简介
htmlparser是一个纯的java写的html《标准通用标记语言下的一个应用》解析的库,它不依赖于其它的java库文件,主要可用于改造或提取html。htmlparser是一个纯的java写的html《标准通用标记语言下的一个应用》解析的库,它不依赖于其它的java库文件,主要可用于改造或提取html。它能超高速解析html,并且不能出错。毫不夸张地说,htmlparser就是当前最好的html解析和分析的工具。不论你是想抓取网页数据还是改造html的内容,用了htmlparser绝对会忍不住称赞。
功能介绍
1、信息转换
链接重写,用于修改页面中的所有超链接,
网页内容拷贝,用于将网页内容保存到本地,
内容检验,可以用来过滤网页上一些令人不愉快的字词,
HTML信息清洗,将本来乱七八糟的HTML信息格式化,
转成XML格式数据。
2、信息提取
文本信息抽取,例如对HTML进行有效信息搜索,
链接提取,用于自动给页面的链接文本加上链接的标签,
资源提取,例如对一些图片、声音的资源的处理,
链接检查,用于检查HTML中的链接是否有效,
页面内容的监控。