Android网络之数据解析----SAX方式解析XML数据

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介:

【正文】

一、XML和Json数据的引入:

通常情况下,每个需要访问网络的应用程序都会有一个自己的服务器,我们可以向服务器提交数据,也可以从服务器获取数据。不过这个时候就有一个问题,这些数据是以什么格式在网络上传输的呢?一般我们都会在网络上传输一些格式化后的数据,这种数据会有一定的结构规格和语言,当另一方受到数据消息后就可以按照相同的结构规格进行解析,从而取出它想要的那部分内容

在网络上传输数据最常用的格式:XML和Json。本文就来学习一下XML数据的解析,Json格式的数据解析将在下一篇文章中讲到。

 

二、XML的介绍:

XML,可扩展标记语言 (Extensible Markup Language) ,用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言,这是百度百科的解释。而XML是一种在Internet中传输数据的常见格式,它与HTML一样,都是SGML(标准通用标记语言),无论你是需要通过Internet访问数据,或者发送数据给Web服务,都可能需要用到XML的知识。恰恰Android应用程序需要和网络交互,否则只是一款单机的无互动的应用程序,所以在Android应用程序开发的过程中使用到XML是很有必要的。

由于XML的扩展性强,致使它需要有稳定的基础规则来支持扩展,该语法规则需要注意的是:

  • 开始和结束标签匹配。
  • 嵌套标签不能相互嵌套。
  • 区分大小写。

XML的结构解析如下:

  • 节点
  • 元素
  • 属性和属性值

格式如下:

<标记名称 属性名1="属性值1" 属性名1="属性值1" ……>内容</标记名称>

 

三、Android中的XML解析的分类:

Android平台最大的优势在于,上层应用基本可以利用Java编程语言开发,Java平台支持通过许多不同的方式来使用XML,并且大多数与XML相关的API已经在Android系统上得到了完全的支持。但是因为Android这个移动设备的局限性,一般仅考虑使用三种方式解析XML:

  • DOM,Document Object Model,文档对象模型方式,解析完的XML将生成一个树状结构的对象。
  • SAX,simple API for  Xml,以事件的形式通知程序,对XML进行解析。
  • XML PULL,类似于SAX方式,程序以拉取的方式对XML进行解析。

 

四、SAX解析介绍:

SAX是一个解析速度快并且占用内存少的xml解析器,非常适合用于Android等移动设备。 SAX解析XML文件采用的是事件驱动,也就是说,它并不需要解析完整个文档,在按内容顺序解析文档的过程中,SAX会判断当前读到的字符是否合法XML语法中的某部分,如果符合就会触发事件。所谓事件,其实就是一些回调(callback)方法,这些方法(事件)定义在ContentHandler接口。

使用SAX的优点:

因为SAX的优势是流的方式处理,当遇到一个标签的时候,并不会记录下之前所碰到的标签。也就是说,在每个节点读取会触发的startElement()方法中,所能知道的信息,仅仅是当前的签名的名字和属性,至于标签嵌套的结构,上层标签的名字,是否有子元素与其他结构相关的信息,都是不知道的。

使用SAX解析XML的简单步骤:

  • 新建一个类MyHandler,继承自DefaultHandler,并重写DefaultHandler中的特有方法,解析XML的工作在此类中完成。
  • 实例化一个SAX解析器的工厂对象,SAXParserFactory对象,使用SAXParserFactory.newInstance()方法获取。
  • 利用SAXParserFactory.newSAXParser()获得SAX解析器对象SAXParser。
  • 实例化MyHandler类,传入需要解析的节点名称。
  • 使用SAXParser.parse()方法设置待解析的XML流和XML解析对象。
  • 最后从MyHandler对象中获得解析结果。

现在详细讲解一下上面提到的类的作用:

DefaultHandler类是SAX2事件处理程序的默认基类。它继承了EntityResolver、DTDHandler、ContentHandler和ErrorHandler这四个接口。包含这四个接口的所有方法,所以我们在编写事件处理程序时,可以不用直接实现这四个接口,而继承该类,然后重写我们需要的方法。

而在继承DefaultHandler的类中,需要重写以下五个方法:

复制代码
public void startDocument()
当遇到文档的开头的时候,调用这个方法,可以在其中做一些预处理的工作。 

public void startElement(String namespaceURI, String localName, String qName, Attributes attributes)
当读到一个开始标签的时候,会触发这个方法,再次获得元素的属性。namespaceURI就是命名空间,localName是不带命名空间前缀的标签名,qName是带命名空间前缀的标签名。通过attributes可以得到所有的属性名和相应的值。要注意的是SAX中一个重要的特点就是它的流式处理,当遇到一个标签的时候,它并不会纪录下以前所碰到的标签,也就是说,在startElement()方法中,所有你所知道的信息,就是标签的名字和属性,至于标签的嵌套结构,上层标签的名字,是否有子元属等等其它与结构相关的信息,都是不得而知的,都需要你的程序来完成。这使得SAX在编程处理上没有DOM来得那么方便。 

public void characters(char[] ch, int start, int length)
这个方法用来处理在XML文件中读到的内容,第一个参数用于存放文件的内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,使用new String(ch,start,length)就可以获取内容。 

public void endElement(String uri, String localName, String name)
和startElement()方法相对应,在遇到结束标签的时候,调用这个方法。

public void endDocument()
和startDocument()方法相对应。当文档结束的时候,调用这个方法,可以在其中做一些善后的工作。 
复制代码

我们通过一个XML文件来讲解一下上面的五个方法在什么时候被执行:

<?xml version="1.0" encoding="utf-8"?>                  startDocument

<persons>                                                             startElement

  <person id="01">                                             startElement

      <name nameid="1">                                   startElement

        smyh                                                         characters

        </name>                                                   endElement

           <age>                                                        startElement

            22                                                             characters

          </age>                                                        endElement

  </person>                      endElement       

</persons>                        endElement

SAXParserFactory类,定义了一个工厂API,使应用程序能够配置和获得基于SAX的解析器以解析XML文档。它只有一个protected的构造方法(单例模式),所以需要使用静态的newInstance()方法来回的SAXParserFactory()对象。使用SAXParserFactory可以通过调用.newSAXParser()方法获得一个SAXParser,通过SAXParser对象可以执行parser()方法,通过传递的参数设定XML流和解析器类。

 

五、SAX解析XML的步骤:(代码实现)

现在通过一个示例程序来讲解一下SAX是怎么解析XML文件的,这个示例程序是运行在Android平台上的,为了模拟真实情况,在tomcat服务器上放置了一个静态的XML文件,即在D:\apache-tomcat-8.0.14\webapps\ROOT目录中新建一个smyhvae.xml文件,xml文件内容如下:

复制代码
<?xml version="1.0" encoding="UTF-8"?>
<persons>
    <person id="01">
        <name>smyh</name>
        <age>22</age>
    </person>
    <person id="02">
        <name>vae</name>
        <age>24</age>
    </person>
</persons>
复制代码

注:关于tomcat服务器的配置,如果不清楚的话,请参照本人另外一篇博客:Android系列之网络(三)----使用HttpClient发送HTTP请求(分别通过GET和POST方法发送数据)

因为我电脑的IP地址是192.168.1.112。现在我们在浏览器输入http://192.168.1.112:8080/smyhvae.xml,显示效果如下:

现在我们需要做的是:通过Android程序去获取并解析这段XML数据。在这个示例程序中,读取person节点的值。因为是Android程序,所以别忘了赋予其访问网络的权限。

整个Android的工程结构如下:

(1)【新建工具类HttpUtils通过URLHttpConnection获取服务器上的XML流

我们将其写成工具类,代码如下:

复制代码
 1 package com.example.androidsaxxml.http;
 2 
 3 import java.io.InputStream;
 4 import java.net.HttpURLConnection;
 5 import java.net.URL;
 6 
 7 //工具类:通过URLHttpConnection获取服务器上的XML流
 8 public class HttpUtils {
 9 
10     public HttpUtils() {
11     }
12     
13     //方法:返回的InputStream对象就是服务器返回的XML流。
14     public static InputStream getXML(String path) {//参数path:之后将在MainActivity中指定具体的url链接
15         try {
16             URL url=new URL(path);
17             if(url!=null)
18             {
19                 HttpURLConnection connection=(HttpURLConnection)url.openConnection();
20                 connection.setDoInput(true);
21                 connection.setConnectTimeout(3000);
22                 connection.setRequestMethod("GET");
23                 int requesetCode=connection.getResponseCode();
24                 if(requesetCode==200)
25                 {
26                     //如果执行成功,返回HTTP响应流
27                     return connection.getInputStream();
28                 }
29             }
30         } catch (Exception e) {
31             // TODO: handle exception
32         }        
33         return null;
34     }
35 } 
复制代码

(2)【新建类MyHandler】新建子类MyHandler,继承DefaultHandler类:用来解析xml

sax解析xml最重要的步骤就是定义一个我们自己的Handler处理类,并让其继承 DefaultHandler 这个类,然后在里面重写其回调方法,在这些回调方法里来做我们的xml解析。代码如下:

复制代码
 1 package com.example.androidsaxxml.handler;
 2 
 3 import java.util.ArrayList;
 4 import java.util.HashMap;
 5 import java.util.List;
 6 
 7 import org.xml.sax.Attributes;
 8 import org.xml.sax.SAXException;
 9 import org.xml.sax.helpers.DefaultHandler;
10 
11 
12 //类:MyHandler,继承DefaultHandler类,用于解析XML数据。
13 //之后在MainActivity中通过设定具体的nodeName来实例化MyHandler
14 public class MyHandler extends DefaultHandler {
15     private List<HashMap<String, String>> list = null; //解析后的XML内容
16     private HashMap<String, String> map = null;  //存放当前需要记录的节点的XML内容
17     private String currentTag = null;//当前读取的XML节点
18     private String currentValue = null;//当前节点的XML文本值
19     private String nodeName = null;//需要解析的节点名称
20     
21     public MyHandler(String nodeName) {
22         // 设置需要解析的节点名称
23         this.nodeName = nodeName;
24     }
25     
26     @Override
27     public void startDocument() throws SAXException {
28         // 接收文档开始的通知
29         // 实例化ArrayList用于存放解析XML后的数据
30         list = new ArrayList<HashMap<String, String>>();
31     }
32     
33     @Override
34     public void startElement(String uri, String localName, String qName,
35             Attributes attributes) throws SAXException {
36         // 接收元素开始的通知        
37         if (qName.equals(nodeName)) {
38             //如果当前运行的节点名称与设定需要读取的节点名称相同,则实例化HashMap
39             map = new HashMap<String, String>();
40         }
41         //Attributes为当前节点的属性值,如果存在属性值,则属性值也读取。
42         if (attributes != null && map != null) {
43             for (int i = 0; i < attributes.getLength(); i++) {
44                 //读取到的属性值,插入到Map中。
45                 map.put(attributes.getQName(i), attributes.getValue(i));
46             }
47         }
48         //记录当前节点的名称。
49         currentTag = qName;
50     }
51     
52     @Override
53     public void characters(char[] ch, int start, int length)
54             throws SAXException {
55         // 接收元素中字符数据的通知。
56         //当前节点有值的情况下才继续执行
57         if (currentTag != null && map != null) {
58             //获取当前节点的文本值,ch这个直接数组就是存放的文本值。
59             currentValue = new String(ch, start, length);
60             if (currentValue != null && !currentValue.equals("")
61                     && !currentValue.equals("\n")) {
62                 //读取的文本需要判断不能为null、不能等于”“、不能等于”\n“
63                 map.put(currentTag, currentValue);
64             }
65         }
66         //读取完成后,需要清空当前节点的标签值和所包含的文本值。
67         currentTag = null;
68         currentValue = null;
69     }
70     
71     @Override
72     public void endElement(String uri, String localName, String qName)
73             throws SAXException {
74         // 接收元素结束的通知。
75         if (qName.equals(nodeName)) {
76             //如果读取的结合节点是我们需要关注的节点,则把map加入到list中保存
77             list.add(map);
78             //使用之后清空map,开始新一轮的读取person。
79             map = null;
80         }
81     }
82     
83     //方法:获取解析之后的数据
84     public List<HashMap<String, String>> getList() {
85         return list;
86     }
87 }
复制代码

(3)【新建类SaxService】实例化一个SAX解析器的工厂对象:SAXParserFactory

需要一个调用SAXParser对象的类,这里新建一个SaxService类,实例化SAXParserFactory用于设定XML流和解析器,也就是在这里调用了上一步中的MyHandler类。代码如下:

复制代码
 1 package com.example.androidsaxxml.service;
 2 
 3 import java.io.InputStream;
 4 import java.util.HashMap;
 5 import java.util.List;
 6 
 7 import javax.xml.parsers.SAXParser;
 8 import javax.xml.parsers.SAXParserFactory;
 9 
10 import com.example.androidsaxxml.handler.MyHandler;
11 
12 
13 //类:用于实例化例化一个SAX解析器的工厂对象:SAXParserFactory
14 public class SaxService {
15 
16     public SaxService() {
17         // TODO Auto-generated constructor stub
18     }
19     
20     //方法:解析xml数据并返回,返回值类型是HashMap
21     public static List<HashMap<String, String>> readXML(InputStream inputStream,String nodeName)
22     {
23         try {
24             //实例化SAX工厂类
25             SAXParserFactory factory=SAXParserFactory.newInstance();
26             //实例化SAX解析器。
27             SAXParser sParser=factory.newSAXParser();
28             //实例化工具类MyHandler,设置需要解析的节点
29             MyHandler myHandler=new MyHandler(nodeName);
30             // 开始解析
31             sParser.parse(inputStream, myHandler);
32             // 解析完成之后,关闭流
33             inputStream.close();
34             //返回解析结果。
35             return myHandler.getList();  //在这里返回解析之后的数据
36         } catch (Exception e) {
37             // TODO: handle exception
38         }        
39         return null;
40     }
41     
42 } 
复制代码

核心代码是第29行和第31行。

(4)在MainActicity中实例化:即实例化需要访问的链接path和需要解析的节点nodeName

布局界面很简单,只有一个按钮控件,这里就不展示布局代码了。点击按钮后,触发点击事件,因为是Android4.0+,所以不能在主线程中访问网络,需要另起一个线程,这里使用Thread类。代码如下: 

复制代码
 1 package com.example.androidsaxxml;
 2 
 3 import java.io.InputStream;
 4 import java.util.HashMap;
 5 import java.util.List;
 6 
 7 import android.app.Activity;
 8 import android.os.Bundle;
 9 import android.view.View;
10 import android.widget.Button;
11 
12 import com.example.androidsaxxml.http.HttpUtils;
13 import com.example.androidsaxxml.service.SaxService;
14 
15 
16 public class MainActivity extends Activity {
17     private Button button;
18     @Override
19     protected void onCreate(Bundle savedInstanceState) {
20         super.onCreate(savedInstanceState);
21         setContentView(R.layout.activity_main);
22         
23         button=(Button)findViewById(R.id.button1);
24         button.setOnClickListener(new View.OnClickListener() {
25             
26             @Override
27             //点击按钮,开启线程访问网络
28             public void onClick(View v) {
29                 Thread thread=new Thread(new Runnable() {
30                     
31                     @Override
32                     public void run() {
33                         // 设置XML文档的路径
34                         String path="http://192.168.1.112:8080/smyhvae.xml";
35                         //调用类HttpUtils:从服务器上获取XML流。
36                         InputStream inputStream=HttpUtils.getXML(path);
37                         try {
38                             //调用类SaxService:解析流,同时设定需要解析的节点
39                             List<HashMap<String, String>> list=SaxService.readXML(inputStream, "person");
40                             for(HashMap<String,String> map:list)
41                             {
42                                 //打印到LogCat中
43                                 System.out.println(map.toString());
44                             }
45                         } catch (Exception e) {
46                             // TODO: handle exception
47                         }
48                     }
49                 });
50                 thread.start();                
51             }
52         });        
53     }
54 }
复制代码

核心代码是第36行(解析具体的url)、39行(从person节点开始读取)。

当点击按钮后,XML解析后的内容会把打印到日志中:

相关文章
|
27天前
|
存储 安全 网络安全
云计算与网络安全:保护数据的新策略
【10月更文挑战第28天】随着云计算的广泛应用,网络安全问题日益突出。本文将深入探讨云计算环境下的网络安全挑战,并提出有效的安全策略和措施。我们将分析云服务中的安全风险,探讨如何通过技术和管理措施来提升信息安全水平,包括加密技术、访问控制、安全审计等。此外,文章还将分享一些实用的代码示例,帮助读者更好地理解和应用这些安全策略。
|
1月前
|
安全 网络安全 数据安全/隐私保护
网络安全与信息安全:从漏洞到加密,保护数据的关键步骤
【10月更文挑战第24天】在数字化时代,网络安全和信息安全是维护个人隐私和企业资产的前线防线。本文将探讨网络安全中的常见漏洞、加密技术的重要性以及如何通过提高安全意识来防范潜在的网络威胁。我们将深入理解网络安全的基本概念,学习如何识别和应对安全威胁,并掌握保护信息不被非法访问的策略。无论你是IT专业人士还是日常互联网用户,这篇文章都将为你提供宝贵的知识和技能,帮助你在网络世界中更安全地航行。
|
2月前
|
存储 安全 网络安全
云计算与网络安全:如何保护您的数据
【10月更文挑战第21天】在这篇文章中,我们将探讨云计算和网络安全的关系。随着云计算的普及,网络安全问题日益突出。我们将介绍云服务的基本概念,以及如何通过网络安全措施来保护您的数据。最后,我们将提供一些代码示例,帮助您更好地理解这些概念。
|
2月前
|
开发工具 Android开发 iOS开发
深入解析安卓与iOS开发环境的优劣
【10月更文挑战第4天】 本文将深入探讨安卓和iOS两大主流移动操作系统的开发环境,从技术架构、开发工具、用户体验等方面进行详细比较。通过分析各自的优势和不足,帮助开发者更好地理解这两个平台的异同,从而为项目选择最合适的开发平台提供参考。
27 3
|
1月前
|
安全 5G Android开发
安卓与iOS的较量:技术深度解析
【10月更文挑战第24天】 在移动操作系统领域,安卓和iOS无疑是两大巨头。本文将深入探讨这两个系统的技术特点、优势和不足,以及它们在未来可能的发展方向。我们将通过对比分析,帮助读者更好地理解这两个系统的本质和内涵,从而引发对移动操作系统未来发展的深思。
46 0
|
2月前
|
安全 Android开发 iOS开发
深入解析:安卓与iOS的系统架构及其对应用开发的影响
本文旨在探讨安卓与iOS两大主流操作系统的架构差异,并分析这些差异如何影响应用开发的策略和实践。通过对比两者的设计哲学、安全机制、开发环境及性能优化等方面,本文揭示了各自的特点和优势,为开发者在选择平台和制定开发计划时提供参考依据。
58 4
|
2月前
|
存储 大数据 数据库
Android经典面试题之Intent传递数据大小为什么限制是1M?
在 Android 中,使用 Intent 传递数据时存在约 1MB 的大小限制,这是由于 Binder 机制的事务缓冲区限制、Intent 的设计初衷以及内存消耗和性能问题所致。推荐使用文件存储、SharedPreferences、数据库存储或 ContentProvider 等方式传递大数据。
79 0
|
2月前
|
安全 网络安全 Android开发
深度解析:利用Universal Links与Android App Links实现无缝网页至应用跳转的安全考量
【10月更文挑战第2天】在移动互联网时代,用户经常需要从网页无缝跳转到移动应用中。这种跳转不仅需要提供流畅的用户体验,还要确保安全性。本文将深入探讨如何利用Universal Links(仅限于iOS)和Android App Links技术实现这一目标,并分析其安全性。
282 0
|
2月前
|
XML 前端开发 Java
讲解SSM的xml文件
本文详细介绍了SSM框架中的xml配置文件,包括springMVC.xml和applicationContext.xml,涉及组件扫描、数据源配置、事务管理、MyBatis集成以及Spring MVC的视图解析器配置。
61 1
|
4月前
|
XML Java 数据格式
Spring5入门到实战------7、IOC容器-Bean管理XML方式(外部属性文件)
这篇文章是Spring5框架的实战教程,主要介绍了如何在Spring的IOC容器中通过XML配置方式使用外部属性文件来管理Bean,特别是数据库连接池的配置。文章详细讲解了创建属性文件、引入属性文件到Spring配置、以及如何使用属性占位符来引用属性文件中的值。
Spring5入门到实战------7、IOC容器-Bean管理XML方式(外部属性文件)