开发者社区> 问答> 正文

httpclient爬虫技术报错 ?报错

本人新手,我最近在自学一个基于java的爬虫程序,我的编程平台是Netbeans,程序如下:

  1.        
  2.         WebClient webclient = new WebClient();    
  3.         
  4.         webclient.getOptions().setCssEnabled(false);   
  5.         webclient.getOptions().setJavaScriptEnabled(false);  
  6.         
  7.         HtmlPage htmlpage = webclient.getPage("https://baidu.com");   
  8.         
  9.         final HtmlForm form = htmlpage.getFormByName("f");  
  10.         
  11.         final HtmlSubmitInput button = form.getInputByValue("百度一下");  
  12.         
  13.         final HtmlTextInput textField = form.getInputByName("wd");   
  14.         
  15.         textField.setValueAttribute("战狼2");   
  16.         
  17.         final HtmlPage nextPage = button.click();  
  18.         
  19.         String result = nextPage.asXml();  
  20.         
  21.         System.out.println(result);    
  22. clean and build以后报错,cannot access ElementTraversal
            final HtmlSubmitInput button = form.getInputByValue("百度一下");  
      class file for org.w3c.dom.ElementTraversal not found
  23. 问问各路神仙,这个问题怎么解决,我在网上自查,说是pom依赖的问题,不知是不是这个问题,如果是pom依赖,请问怎么具体解决这个问题,困扰了我2个月了,谢谢。

展开
收起
爱吃鱼的程序员 2020-06-07 18:05:32 522 0
1 条回答
写回答
取消 提交回答
  • https://developer.aliyun.com/profile/5yerqm5bn5yqg?spm=a2c6h.12873639.0.0.6eae304abcjaIB
                        <p>如果是pom依赖的问题你直接在pom.xml文件中添加对应的依赖不就好了</p>
    
                    
    
                            关键是我不会pom依赖,问了一个做技术的朋友,初步了解了maven以后,先建的maven文件,算是找到了pom文件,然后把网上说明的<dependency>...</dependency>格式的代码加上才算clean通过,但是现在run文件的时候还是不行。。。
    

    说是MojoExecutionException异常,我现在还是不知道这个怎么解决。。。估计我还得受困好几天

    2020-06-07 18:05:45
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Python第五讲——关于爬虫如何做js逆向的思路 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载