jsoup简介
jsoup是一个用于处理真实世界HTML的Java库。它提供了一个非常方便的API来提取和操作数据,使用最好的DOM,CSS和类似jquery的方法。jsoup实现WHATWG HTML5规范,并将HTML解析为与现代浏览器相同的DOM。
maven地址 http://www.mvnrepository.com/artifact/org.jsoup/jsoup
compile 'org.jsoup:jsoup:1.9.2'
爬取方法:
Document doc = Jsoup.connect("https://nba.hupu.com/games/playbyplay/154254")                            //.data("query", "Java") //请求参数                            //.userAgent("I’mjsoup") //设置User-Agent                            //.cookie("auth", "token") //设置cookie                            .timeout(3000) //设置连接超时时间                            .get();
解析方法:
 Elements trs = doc.select("table").select("tr");                    for (int i = 0; i < trs.size(); i++) {                        Elements tds = trs.get(i).select("td");                        if (!trs.get(i).id().equals("")) {                            if (!trs.get(i).id().equals("10000") && !trs.get(i).id().equals("10001")) {                                describeBean = new DescribeBean();                                for (int j = 0; j < tds.size(); j++) {                                    String text = tds.get(j).text();                                    switch (j) {                                        case 0:                                            describeBean.setTime(text);                                            break;                                        case 1:                                            describeBean.setScore(text);                                            break;                                        case 2:                                            describeBean.setTeamName(text);                                            break;                                        case 3:                                            describeBean.setDescribe(text);                                            break;                                    }                                }                            }                            if (describeBean != null) {                                list.add(describeBean);                            }                        }                    }                    System.out.println(JSON.toJSONString(list));
这里写一个解析示例:
 String s = " \n" +                        "   \n" +                        "    

\n" + " \n" + " \n" + " \n" + " ABC15829684580\n" + " \n" + " \n" + " \n" + "

\n" + " \n" + "\n";
    
Document doc = Jsoup.parse(s);                Elements trs = doc.select("div").select("p").select("span").select("span").select("strong").select("em");                LogUtils.e(trs.get(0).text());
这里从div开始解析 从div逐一解析到em
("div").select("p").select("span").select("span").select("strong").select("em")
最后输出的结果是
ABC15829684580


    
    
    



更多相关文章

  1. SpringBoot 2.0 中 HikariCP 数据库连接池原理解析
  2. Android(安卓)ART invoke 代码生成
  3. android 判断字符串是否为空的最优方法
  4. Hello Android(安卓)- PULL方式解析XML
  5. MPAndroidChart开源图表库(一)之饼状图
  6. Android(安卓)Volley 完全解析(三),定制自己的Request
  7. android中-----JSON数据解析
  8. android media server 解析1-media player service 结构部分
  9. 使用线程执行堆栈StackTraceElement设计Android日志模块

随机推荐

  1. Android 应用程序之间数据共享—ContentP
  2. Android 之 Looper、MessageQueue、Handl
  3. Android使用LayerDrawable资源
  4. [置顶] Android 位于底部的Tab
  5. android操作sim卡联系人信息
  6. android另一种访问包资源方式
  7. Android 4.3源码的下载和编译环境的安装
  8. android 的相对布局的使用小记
  9. android 动画Animation属性大全(-)
  10. [置顶] Android(安卓)Small UI实际应用总