JAVA—其他—Avro序列化

简介: Avro是hadoop的一个用于序列化的组件理解特点:1. 高效2. 序列化后体积小3. 动态 动态指的是数据的结构一旦定义,可以在多处语言生成实体类

Avro是hadoop的一个用于序列化的组件

理解特点:

  1. 高效
  2. 序列化后体积小
  3. 动态 动态指的是数据的结构一旦定义,可以在多处语言生成实体类

引用jar包

<properties>

       <maven.compiler.source>8</maven.compiler.source>

       <avro.version>1.10.2</avro.version>

   </properties>



   <dependencies>

       <dependency>

           <groupId>org.apache.avro</groupId>

           <artifactId>avro</artifactId>

           <version>${avro.version}</version>

       </dependency>

   </dependencies>

引用maven插件(如不生成代码可不必引用)

<!-- avro-maven-plugin -->

           <plugin>

               <groupId>org.apache.avro</groupId>

               <artifactId>avro-maven-plugin</artifactId>

               <version>${avro.version}</version>

               <executions>

                   <execution>

                       <phase>generate-sources</phase>

                       <goals>

                           <goal>schema</goal>

                       </goals>

                       <configuration>

                           <sourceDirectory>${project.basedir}/src/main/resources/avro/</sourceDirectory>

                           <outputDirectory>${project.build.directory}/generated/avro</outputDirectory>

                       </configuration>

                   </execution>

               </executions>

           </plugin>

插件中需要配置

  1. sourceDirectory: avro文件的目录,此处的avro文件也就是定义好的数据结构
  2. outputDirectory: 插件生成的实体存放的目录


1.快速使用


package com.zy.learn;


import com.zy.learn.avro.User;

import org.apache.avro.file.DataFileReader;

import org.apache.avro.file.DataFileWriter;

import org.apache.avro.generic.GenericDatumReader;

import org.apache.avro.generic.GenericRecord;

import org.apache.avro.io.DatumReader;

import org.apache.avro.io.DatumWriter;

import org.apache.avro.specific.SpecificDatumReader;

import org.apache.avro.specific.SpecificDatumWriter;


import java.io.File;

import java.io.IOException;


/**

* @Author: Zy

* @Date: 2021/10/26 9:30

* avro测试类

*/

public class AvroTest {

   /**

    * 测试序列化

    *

    * @author Zy

    * @date 2021/10/26

    */

   public static void testSerializing() throws IOException {

       User user1 = User.newBuilder()

               .setName("zy")

               .setFavoriteNumber(10)

               .setFavoriteColor("hhh")

               .build();


       DatumWriter<User> userDatumWriter = new SpecificDatumWriter<User>(User.class);

       DataFileWriter<User> dataFileWriter = new DataFileWriter<User>(userDatumWriter);

       dataFileWriter.create(user1.getSchema(), new File("users.avro"));

       dataFileWriter.append(user1);

       dataFileWriter.close();

   }


   /**

    * 反序列化

    * @author Zy

    * @date 2021/10/28

    */

   public static void testDeserializing() throws IOException {

       GenericDatumReader<GenericRecord> userDatumReader = new GenericDatumReader<>();

       DataFileReader<GenericRecord> dataFileReader = new DataFileReader<GenericRecord>(new File("users.avro"), userDatumReader);

       GenericRecord user = null;

       while (dataFileReader.hasNext()) {

           user = dataFileReader.next(user);

           System.out.println(user);

       }

   }


   public static void main(String[] args) throws IOException {

//        testSerializing();

       testDeserializing();

   }

}


说明:

avro序列化如果使用代码生成,生成了实体后就直接使用实体作为泛型序列化和反序列化即可 类似上文例子中的测试序列化中的写法

如果没有使用代码生成,则没有实体类,此时avro提供了一个公共的类可以作为泛型,GenericRecord

目录
相关文章
|
4月前
|
存储 Java
【IO面试题 四】、介绍一下Java的序列化与反序列化
Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输,之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。
|
1月前
|
存储 安全 Java
🌟Java零基础-反序列化:从入门到精通
【10月更文挑战第21天】本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
72 5
|
1月前
|
存储 缓存 安全
🌟Java零基础:深入解析Java序列化机制
【10月更文挑战第20天】本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
29 3
|
1月前
|
存储 安全 Java
Java编程中的对象序列化与反序列化
【10月更文挑战第22天】在Java的世界里,对象序列化和反序列化是数据持久化和网络传输的关键技术。本文将带你了解如何在Java中实现对象的序列化与反序列化,并探讨其背后的原理。通过实际代码示例,我们将一步步展示如何将复杂数据结构转换为字节流,以及如何将这些字节流还原为Java对象。文章还将讨论在使用序列化时应注意的安全性问题,以确保你的应用程序既高效又安全。
|
3月前
|
JSON NoSQL Java
redis的java客户端的使用(Jedis、SpringDataRedis、SpringBoot整合redis、redisTemplate序列化及stringRedisTemplate序列化)
这篇文章介绍了在Java中使用Redis客户端的几种方法,包括Jedis、SpringDataRedis和SpringBoot整合Redis的操作。文章详细解释了Jedis的基本使用步骤,Jedis连接池的创建和使用,以及在SpringBoot项目中如何配置和使用RedisTemplate和StringRedisTemplate。此外,还探讨了RedisTemplate序列化的两种实践方案,包括默认的JDK序列化和自定义的JSON序列化,以及StringRedisTemplate的使用,它要求键和值都必须是String类型。
redis的java客户端的使用(Jedis、SpringDataRedis、SpringBoot整合redis、redisTemplate序列化及stringRedisTemplate序列化)
|
2月前
|
存储 Java
Java编程中的对象序列化与反序列化
【10月更文挑战第9天】在Java的世界里,对象序列化是连接数据持久化与网络通信的桥梁。本文将深入探讨Java对象序列化的机制、实践方法及反序列化过程,通过代码示例揭示其背后的原理。从基础概念到高级应用,我们将一步步揭开序列化技术的神秘面纱,让读者能够掌握这一强大工具,以应对数据存储和传输的挑战。
|
2月前
|
存储 安全 Java
Java编程中的对象序列化与反序列化
【10月更文挑战第3天】在Java编程的世界里,对象序列化与反序列化是实现数据持久化和网络传输的关键技术。本文将深入探讨Java序列化的原理、应用场景以及如何通过代码示例实现对象的序列化与反序列化过程。从基础概念到实践操作,我们将一步步揭示这一技术的魅力所在。
|
2月前
|
消息中间件 存储 Java
大数据-58 Kafka 高级特性 消息发送02-自定义序列化器、自定义分区器 Java代码实现
大数据-58 Kafka 高级特性 消息发送02-自定义序列化器、自定义分区器 Java代码实现
51 3
|
2月前
|
分布式计算 资源调度 Hadoop
Hadoop-10-HDFS集群 Java实现MapReduce WordCount计算 Hadoop序列化 编写Mapper和Reducer和Driver 附带POM 详细代码 图文等内容
Hadoop-10-HDFS集群 Java实现MapReduce WordCount计算 Hadoop序列化 编写Mapper和Reducer和Driver 附带POM 详细代码 图文等内容
100 3
|
2月前
|
Java 数据库 对象存储
Java 序列化详解
本文详细解析了Java序列化的概念与应用。通过具体实例,深入探讨了其在对象存储和传输中的作用及实现方法,帮助读者理解如何有效利用这一特性来简化数据交换,并对其实现机制有了更深入的认识。
52 9