Java 基础入门 | 第十七章 Java操作XML文件

本文涉及的产品
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 目录前言dom4jdom4j概述dom4j的封装和优势面向接口编程支持多种解析机制下载和安装dom4jdom4j常用APIXML文档基本操作XML文档基本操作-DocumentXML文档基本操作-ElementXML文档基本操作-AttributeXML文档基本


前言

JAXP虽然在DOM和SAX解析机制上进行了一定的抽象,但是对XML解析非常繁琐,编程代码冗长,可读性不高。因此在JAVA领域出现了两个开源的XML解析器:dom4j和JDOM。dom4j的开发者说:使用dom4j来解析XML文档,无须参考任何图书,只要有基本的DOM概念,那么

对着dom4j的API文档即可使用dom4j解析。

dom4j

dom4j概述

dom4j是一套开源的XML解析工具,完全支持DOM、SAX和JAXP机制。与它们相比, dom4j

更为简单易用,因此实际项目中往往选择dom4j作为XML解析器。dom4j没有提供其他语言版本,只提供JAVA语言版本。

dom4j的封装和优势

dom4j在很大程序上简化了XML的处理方式。从表面上看, dom4j有点类似于DOM解析机制,也

将XML文档转换为一棵结构化树(dom4j树),但dom4j树的处理方式比DOM树更为简单。

   由于dom4j如此优秀,很多优秀的开源项目都采用dom4j作为XML解析器,在实际的开发过程中,它通常是首选。

面向接口编程

   它的实质是以其他XML解析器为基础, dom4j采用面向接口编程的方式来处理XML文档解析,这就允许dom4j的底层可以在不同的解析机制之间自由切换。

支持多种解析机制

    • DOMReader:它负责根据W3C的DOM树创建dom4j树
    • SAXReader:它基于SAX解析机制来分析一份XML文档,并将其转换为dom4j树
    • XPP3Reader:其底层需要依赖于XML Pulll Parser 3.x来解析XML文档,并将其转换为dom4j树
    • XPPReader:其底层需要依赖于XML Pulll Parser 2.x来解析XML文档,并将其转换为dom4j树    

    下载和安装dom4j

    登录dom4j的官方站点下载最新版本dom4j1.6.1

    下载完成后得到dom4j1.6.1.zip,将其解压缩可得到如下目录结构

    docs:该目录下存放了dom4j的说明文件和API文档

    lib:该目录下存放了dom4j编译和运行所依赖的第三方类库

    Src:该目录下存放了dom4j项目的所有源文件

    xdocs:该目录存放dom4j的一些相关文档,是XML格式

    xml:该目录下存放了dom4j提供了一些简单的范例xml文档

    dom4j-1.6.1.jar:dom4j的核心JAR包

    将dom4j-1.6.1.jar添加到系统CLASSPATH环境变量中    

     

    dom4j常用API

    image.gif编辑

    image.gif编辑

    XML文档基本操作

    XML文档基本操作-Document

    获取XML文档对象Document

    import org.dom4j.Document;
    import org.dom4j.DocumentException;
    import org.dom4j.io.SAXReader;
    import java.io.File;
    import java.net.MalformedURLException;
    public class XMLTest {
        public static void main(String[] args) throws MalformedURLException, DocumentException {
            File xmlFile = new File("pom.xml");
            SAXReader reader = new SAXReader();
            Document xmlDoc = reader.read(xmlFile);
        }
    }

    image.gif

    XML文档基本操作-Element

    获取根元素对象  

    Element root = xmlDoc.getRootElement();

    image.gif

    获取根元素名称

    String elementName = root.getName();

    image.gif

    通过元素名称获取元素对象集合

    Element element = root.element(“元素名称");

    image.gif

    获取所有直接子元素对象集合

    List elementList = root.elements();

    image.gif

    获取element元素的内部文本

    String text = element.getText();

    image.gif

    获取element子元素内部文本

     

    String text = element.elementText(“子元素名称”);

    image.gif

    遍历XML树DOM4J提供至少3种遍历节点的方法:

    枚举(Iterator)

    // 枚举所有子节点
        for ( Iterator i = root.elementIterator(); i.hasNext(); ) {
            Element element = (Element) i.next();
            // do something
        }
        // 枚举名称为foo的节点
        for ( Iterator i = root.elementIterator(foo); i.hasNext();) {
            Element foo = (Element) i.next();
            // do something
        }
        // 枚举属性
        for ( Iterator i = root.attributeIterator(); i.hasNext(); ) {
            Attribute attribute = (Attribute) i.next();
            // do something
        }

    image.gif

    递归

    public void treeWalk(Element element) {
      for (int i = 0, size = element.nodeCount(); i < size; i++){
          Node node = element.node(i);
          //如果得到的节点是一个元素就继续寻找子节点
          if (node instanceof Element) {
            treeWalk((Element) node);
          } else {
            // do something....
          }
         }
    }

    image.gif

    Visitor模式

    public class MyVisitor extends VisitorSupport {
        public void visit(Element element){
            System.out.println(element.getName());
        }
        public void visit(Attribute attr){
            System.out.println(attr.getName());
        }
    }

    image.gif

    调用 :root.accept(new MyVisitor()) 就可以了,Visitor接口提供多种Visit()的重载,根据XML不同的对象,将采用不同的方式来访问。上面是给出的Element和Attribute的简单实现,一般比较常用的就是这两个。VisitorSupport是DOM4J提供的默认适配器 。注意:这个Visitor是自动遍历所有节点的。如果是root.accept(MyVisitor),将遍历子节点

    XML文档基本操作-Attribute

    获取元素属性对象
    通过属性名获取元素属性对象

    Attribute   attribute = element.attribute(“属性名称");

    image.gif

    通过索引获取属性对象

    Attribute  attribute = element.attribute(0);

    image.gif

    获取所有属性对象集合

    List  attributeList = root.attributes();

    image.gif

    获取属性值
    通过属性对象

    String value = attribute.getValue();

    image.gif

    通过元素对象

    String  value = element.attributeValue(“属性名称”);

    image.gif

    XML文档基本操作-创建

    创建文档Document

    Document document = DocumentHelper. createDocument();

    image.gif

    创建元素

    Element element = document.addElement(“元素名称");

    image.gif

    创建属性

    element. addAttribute(“属性名”,“属性值");

    image.gif

    添加属性方法返回的是原元素对象。如同StringBuffer。
    创建文本

    element.addText(“文本");

    image.gif

    XML文档基本操作-删除节点

      • remove(Element element)
      • remove(Attribute attribute)
      • remove(Text text)
      • remove(Node node)

      Node接口的子类对象都可以移除

      注意:remove是移除直接子节点时使用

      parentElement.remove(childElement);

      image.gif

      XML文档基本操作-建立xml文件

      建立xml文件

      FileWriter fw = new FileWriter(“students2.xml”);
      XMLWriter writer = new XMLWriter(fw);
      writer.write(document);
      writer.close();

      image.gif

      建立漂亮的xml文档,可以指定字符编码

      OutputFormat format = OutputFormat.createPrettyPrint();
      format.setEncoding(“GBK");
      XMLWriter writer = new XMLWriter(fw,format);

      image.gif

      XML文档基本操作-查询节点

      获取所有符合条件的节点
      selectNodes(String xpathExpression) 返回List集合

      List nodes= root.selectNodes("//dependency");

      image.gif

      获取符合条件的单个节点
      selectSingleNode(String xpathExpression) 返回一个Node对象。    
      如果符合条件的节点有多个,那么返回第一个。

      Node node= root.selectSingleNode("//dependency");

      image.gif

      注意:使用dom4j-1.6.1.jar时,需要另一个包jaxen-1.1-beta-6.jar提供支持

      XPath支持

      XPath简介

      XPath是一个获取XML文档中你所需要的节点元素的组件。它允许你用很少的代码就能获取指定的路径下你所选取的节点的值。

      DOM4J对XPath有良好的支持,如访问一个节点,可直接用XPath选择

      public void bar(Document document) {
                  List list = document.selectNodes( //foo/bar );
                  Node node = document.selectSingleNode(//foo/bar/author);
                  String name = node.valueOf( @name );
          }

      image.gif

      选择属性

        • 注释:用“/”路径开始代表元素的绝对路径.
        • 用“//”路径开始代表整个文档满足条件的所有元素
        • 在XPath中,所有属性使用@前缀
        • 下面的XPath表达式,选取所有名为catalog的属性
        • //@catalog
        • 下面的XPath表达式,选取所有具有catalog属性的item元素
        • //item[@catalog]
        • 下面的XPath表达式,选取所有具有任何属性的item元素
        • //item[@*]
        • 下面的XPath表达式,选取所有具有catalog等于"parts"属性的item元素
        • //item[@catalog="parts"]

        XPath语法

        image.gif编辑


        相关文章
        |
        20天前
        |
        算法 Java 开发者
        Java 编程入门:从零到一的旅程
        本文将带领读者开启Java编程之旅,从最基础的语法入手,逐步深入到面向对象的核心概念。通过实例代码演示,我们将一起探索如何定义类和对象、实现继承与多态,并解决常见的编程挑战。无论你是编程新手还是希望巩固基础的开发者,这篇文章都将为你提供有价值的指导和灵感。
        |
        21天前
        |
        存储 Java 程序员
        Java中的集合框架:从入门到精通
        【8月更文挑战第30天】在Java的世界里,集合框架是一块基石,它不仅承载着数据的存储和操作,还体现了面向对象编程的精髓。本篇文章将带你遨游Java集合框架的海洋,从基础概念到高级应用,一步步揭示它的奥秘。你将学会如何选择合适的集合类型,掌握集合的遍历技巧,以及理解集合框架背后的设计哲学。让我们一起探索这个强大工具,解锁数据结构的新视角。
        |
        8天前
        |
        Java 程序员
        Java中的异常处理:从入门到精通
        在Java编程的世界中,异常处理是保持程序稳定性和可靠性的关键。本文将通过一个独特的视角—把异常处理比作一场“捉迷藏”游戏—来探讨如何在Java中有效管理异常。我们将一起学习如何识别、捕捉以及处理可能出现的异常,确保你的程序即使在面对不可预见的错误时也能优雅地运行。准备好了吗?让我们开始这场寻找并解决Java异常的冒险吧!
        |
        20天前
        |
        Java 程序员 UED
        Java 中的异常处理:从入门到精通
        【8月更文挑战第31天】在Java编程的世界中,异常处理是保持应用稳定性的重要机制。本文将引导你理解异常的本质,学会如何使用try-catch语句来捕获和处理异常,并探索自定义异常类的魅力。我们将一起深入异常的世界,让你的代码更加健壮和用户友好。
        |
        20天前
        |
        Java 数据库连接 开发者
        Java中的异常处理:从入门到精通
        【8月更文挑战第31天】 在编程世界中,错误和异常就像是不请自来的客人,总是在不经意间打扰我们的程序运行。Java语言通过其异常处理机制,为开发者提供了一套优雅的“待客之道”。本文将带你走进Java异常处理的世界,从基础语法到高级技巧,再到最佳实践,让你的程序在面对意外时,也能从容不迫,优雅应对。
        |
        20天前
        |
        Java 开发者
        Java 中的异常处理:从入门到精通
        【8月更文挑战第31天】在Java的世界中,异常处理是保持程序健壮性的基石。本文将带你探索Java异常处理的奥秘,从基本的try-catch语句到深入理解自定义异常和最佳实践。你将学会如何优雅地处理错误,确保你的代码不仅能够面对意外情况,还能从中恢复。让我们一起开启这段旅程,掌握让程序更加稳定和可靠的技巧吧!
        |
        23天前
        |
        机器学习/深度学习 Java TensorFlow
        深度学习中的图像识别:从理论到实践Java中的多线程编程入门指南
        【8月更文挑战第29天】本文将深入探讨深度学习在图像识别领域的应用,从基础理论到实际应用案例,带领读者一步步理解如何利用深度学习技术进行图像识别。我们将通过一个简单的代码示例,展示如何使用Python和TensorFlow库实现一个基本的图像识别模型。无论你是初学者还是有一定经验的开发者,都能从中获得启发和学习。 【8月更文挑战第29天】在Java世界里,线程是程序执行的最小单元,而多线程则是提高程序效率和响应性的关键武器。本文将深入浅出地引导你理解Java多线程的核心概念、创建方法以及同步机制,帮助你解锁并发编程的大门。
        |
        6天前
        |
        存储 缓存 安全
        【Java面试题汇总】多线程、JUC、锁篇(2023版)
        线程和进程的区别、CAS的ABA问题、AQS、哪些地方使用了CAS、怎么保证线程安全、线程同步方式、synchronized的用法及原理、Lock、volatile、线程的六个状态、ThreadLocal、线程通信方式、创建方式、两种创建线程池的方法、线程池设置合适的线程数、线程安全的集合?ConcurrentHashMap、JUC
        【Java面试题汇总】多线程、JUC、锁篇(2023版)
        |
        17天前
        |
        监控 Java 调度
        【Java学习】多线程&JUC万字超详解
        本文详细介绍了多线程的概念和三种实现方式,还有一些常见的成员方法,CPU的调动方式,多线程的生命周期,还有线程安全问题,锁和死锁的概念,以及等待唤醒机制,阻塞队列,多线程的六种状态,线程池等
        79 6
        【Java学习】多线程&JUC万字超详解
        |
        2天前
        |
        Java
        深入理解Java中的多线程编程
        本文将探讨Java多线程编程的核心概念和技术,包括线程的创建与管理、同步机制以及并发工具类的应用。我们将通过实例分析,帮助读者更好地理解和应用Java多线程编程,提高程序的性能和响应能力。
        15 4