kzkn.net
当前位置:首页 >> 如何使用JAvA抓取网页上指定部分的内容 >>

如何使用JAvA抓取网页上指定部分的内容

java可以模拟http请求出来的html之后然后 用正则表达式筛选出来需要的内容

java可以模拟http请求出来的html之后然后 用正则表达式筛选出来需要的内容

java只能get到整个网页的内容,然后做内容解析。或者你用js解析好了传给后台。

FileReader fr = new FileReader("*.htm"); FileWriter fw = new FileWriter("E:/a.txt"); char[] c = new char[1024]; StringBuffer sb = new StringBuffer(); int n; while ((n = fr.read(c)) != -1) { sb.append(c, 0, n); } fr.close(); Pat...

String name="F:\\workspace\\ssh_phot.....\1444783552338pic.jpg"; int i=name.lastIndexOf("\\"); String naem1=name.substring(i+1);

在工程中导入Jsoup.jar包 获取网址url指定HTML或者文档指定的body 获取网页中超链接的标题和链接 获取指定博客文章的内容 获取网页中超链接的标题和链接的结果

python的确方便很多,java的话那你就用爬虫吧

正则表达是可以满足你

FileReader fr = new FileReader("*.htm"); FileWriter fw = new FileWriter("E:/a.txt"); char[] c = new char[1024]; StringBuffer sb = new StringBuffer(); int n; while ((n = fr.read(c)) != -1) { sb.append(c, 0, n); } fr.close(); Pat...

使用 Jsoup这个处理 html的库 Document doc = Jsoup.parseBodyFragment("123 acx a12a"); String text = doc.select("class").first().text(); // 123 acx a12a

网站首页 | 网站地图
All rights reserved Powered by www.kzkn.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com