用户指南—数据导入和导出—使用Batch Tool工具导入导出数据

简介: 本文介绍了通过Batch Tool工具导入导出数据的方法。

工具介绍

Batch Tool工具是PolarDB-X团队开发的专为PolarDB-X数据库提供数据导入导出服务的工具。

Batch Tool工具采用JAVA语句实现,核心是生产者消费者模型,支持多线程操作,提供批量导出、批量导入、批量删除、批量更新等功能。数据以csv文件格式传输,方便用户进行数据交互。

Batch Tool工具的命令用法和参数如下:


usage: BatchTool [-?] [-batchsize ] [-con ] [-cs
           ] -D  [-dir ] [-f ] [-F
           ] [-func] -h  [-header] [-i] [-in] [-L ]
           [-lastSep] [-lb] [-local] [-maxConn ] [-minConn ]
           [-noesc] [-np] [-O ] -o  [-OC            column>] -p  [-P ] [-para] [-pre ] [-pro
           ] [-quote ] [-readsize ]
           [-rfonly] [-ringsize ] -s  [-t 
] -?,--help Help message. -batchsize,--batchSize Batch size of emitted tuples. -con,--consumer Configure number of consumer threads. -cs,--charset Define charset of files. -D,--database Database to use. -dir,--dir Directory path including files to import. -f,--from Source file(s), separated by ; . -F,--filenum Fixed number of exported files. -func,--sqlfunc Use sql function to update. -h,--host Connect to host. -header,--header Whether the header line is column names. -H,--historyFile history file name for resuming from breakpoint -i,--ignoreandresume Flag of insert ignore & resume from breakpoint -in,--wherein Using where ... in (...) -L,--line Max line limit of exported files. -lastSep,--withLastSep Whether line ends with separator. -lb,--loadbalance If using load balance. -local,--localmerge o local merge sort. -maxConn,--maxConnection Max connection number limit. -minConn,--minConnection Mim connection number limit. -noesc,--noescape Don't escape values. -np,--noparttion No use of parttion. -O,--orderby asc or desc. -o,--operation Batch operation type: export / import / delete / update. -OC,--orderCol col1;col2;col3. -p,--password Password to use when connecting to server. -P,--port Port number to use for connection. -para,--paraMerge Using parallel merge when doing order by export. -pre,--prefix Export file name prefix. -pro,--producer Configure number of producer threads. -quote,--quoteMode The mode of how field values are enclosed by double-quotes when exporting table. Default value is auto. -readsize,--readSize Read block size in MB. -rfonly,--rfonly Only read and process file, no sql execution. -ringsize,--ringBufferSize Ring buffer size. -s,--sep Separator between fields (delimiter). -t,--table -tps,--tpsLimit Tps limit -u,--user User for login. -w,--where Where condition: col1>99 AND col2<100 ...

参数说明

常用参数说明如下:

  • -o:批处理操作,包括export、import、delete、update四个选项。
  • -t:指定目标表名,只能为单个表。
  • -s:指定分隔符,可以为字符或字符串。
  • -f:指定源文件,多个文件名之间使用分号“;”分隔。
  • -OC:指定导出时排序使用的列名,多个列之间使用分号“;”分隔。
  • -cs:指定文本文件的字符集,默认为utf-8。
  • -lastSep:文件每行是否以分隔符结尾。
  • -quote:指定导出或导入时引号包围模式,包括以下三个可选值:
    • auto:默认模式,将根据字段值是否包含特殊字符(如分隔符、换行符等)来添加双引号;
    • force:强制每个字段值都添加双引号;
    • none:强制不添加双引号(适用于已知表字段类型都是数值型、或字符串型字段中不包含特殊字符的情况)。
  • -header:首行是否为字段名。
  • -i:是否开启insert ignore与断点续传。
  • -pre:指定导出文件名的前缀。
  • -F:指定导出文件数量。

工具获取

Batch Tool工具的jar包,单击下载:Batch_tool工具

使用示例

以编译生成的batch-tool.jar为例,查看参数说明:


java -jar batch-tool.jar -?
  • 批量导出数据
## 1.默认导出(文件数等于表的分片数)

java -jar batch-tool.jar -h 127.0.0.1 -u testUser -p testPasswd -P 3306 -D db_name -o export -t table_name -s ,
## 2.导出文件数=3 (-F:指定文件数)
java -jar batch-tool.jar -h 127.0.0.1 -u testUser -p testPasswd -P 3306 -D db_name -o export -t table_name -s , -F 3
## 3.指定单个文件最大行数=10000 (-L:指定单文件行数)
java -jar batch-tool.jar -h 127.0.0.1 -u testUser -p testPasswd -P 3306 -D db_name -o export -t table_name -s , -L 10000
## 4.带where条件 若条件带有空格,需要使用引号 (-w:where条件语句)
java -jar batch-tool.jar -h 127.0.0.1 -u testUser -p testPasswd -P 3306 -D db_name -o export -t table_name -s , -w "id < 150 and id > 120"
  • 批量导入数据(需手动创建目标表,Batch Tool只包含数据传输)
## 1.多个文件用分号 (;) 分隔
java -jar batch-tool.jar -h 127.0.0.1 -u testUser -p testPasswd -P 3306 -D db_name -o import -t table_name -s , -f "table_name_0;table_name_1;table_name_2;table_name_3"
## 2.默认根据拆分键进行sharding插入, 如不采用,打开-np开关即可
java -jar batch-tool.jar -h 127.0.0.1 -u testUser -p testPasswd -P 3306 -D db_name -o import -t table_name -s , -f "file0;file2" -np
## 3.指定生产者、消费者线程(-pro:生产者线程,读取文件线程; -con:消费者线程,导入数据线程)
java -jar batch-tool.jar -h 127.0.0.1 -u testUser -p testPasswd -P 3306 -D db_name -o import -t table_name -s , -f "table_name_0;table_name_1" -np -pro 16 -con 16
## 4.打开insert ignore和断点续传
java -jar batch-tool.jar -h 127.0.0.1 -u testUser -p testPasswd -P 3306 -D db_name -o import -t table_name -s , -f "table_name_0;table_name_1" -i
  • 批量删除数据(删除数据库中包含文件中的数据,原理:构建DELETE语句,根据表结构填充文件中的数据)
java -jar batch-tool.jar -h 127.0.0.1 -u testUser -p testPasswd -P 3306 -D db_name -o delete -t table_name -s , -f "file0"
  • 批量更新数据(更新数据库中包含文件中的数据,原理:构建UPDTATE语句,根据表结构填充文件中的数据)
java -jar batch-tool.jar -h 127.0.0.1 -u testUser -p testPasswd -P 3306 -D db_name -o update -t table_name -s ,
相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
相关文章
|
机器学习/深度学习 算法 TensorFlow
深度学习中的自编码器:从理论到实践
在这篇文章中,我们将深入探讨深度学习的一个重要分支——自编码器。自编码器是一种无监督学习算法,它可以学习数据的有效表示。我们将首先介绍自编码器的基本概念和工作原理,然后通过一个简单的Python代码示例来展示如何实现一个基本的自编码器。最后,我们将讨论自编码器的一些变体,如稀疏自编码器和降噪自编码器,以及它们在实际应用中的优势。
|
11月前
|
人工智能 搜索推荐 Serverless
打造智能购物新体验:主动式智能导购AI助手解决方案评测
阿里云推出的《主动式智能导购AI助手构建》解决方案,基于百炼大模型和函数计算,采用Multi-Agent架构,提供个性化、智能化的购物体验。系统具备主动交互、精准推荐、自动化架构等亮点,支持快速部署和生产环境应用。评测结果显示,该方案在功能效果和架构设计上表现出色,但仍需优化文档和技术细节。欢迎参加官方评测活动... 详细评测及参与方式请参考:[链接](https://developer.aliyun.com/topic/build-an-ai-shopping-assistant?spm=a2c6h.12873639.article-detail.17.13902d93dZhiyK)。
936 2
打造智能购物新体验:主动式智能导购AI助手解决方案评测
|
缓存 关系型数据库 MySQL
MySQL 查询优化:提速查询效率的13大秘籍(索引设计、查询优化、缓存策略、子查询优化以及定期表分析和优化)(中)
MySQL 查询优化:提速查询效率的13大秘籍(索引设计、查询优化、缓存策略、子查询优化以及定期表分析和优化)(中)
2345 0
|
缓存 并行计算 负载均衡
大模型推理优化实践:KV cache复用与投机采样
在本文中,我们将详细介绍两种在业务中实践的优化策略:多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现,并分享一些实现时的关键技巧。
|
存储 安全 算法
深入理解操作系统的内存管理机制
【4月更文挑战第29天】 在现代计算机系统中,操作系统的内存管理是一个至关重要的组成部分。它不仅负责物理内存的分配与回收,还涉及虚拟内存到物理内存的映射、内存保护以及效率优化等多个方面。本文将深入探讨操作系统内存管理的基本原理和关键技术,包括分页系统、分段、请求分页和分段以及它们在现代操作系统中的应用。文章旨在为读者提供一个清晰、系统的内存管理知识框架,并通过分析不同内存管理技术的优势和挑战来展望内存管理的发展趋势。
|
XML Java 数据格式
如何在Filter中使用Spring容器中的Bean?
如何在Filter中使用Spring容器中的Bean?
593 0
|
Linux Shell 开发工具
linux基本功系列之alias命令实战
linux基本功系列之alias命令实战
514 0
linux基本功系列之alias命令实战
|
Linux 开发工具
详解 Vim 三种模式之一:可视模式
Vim是Linux中最常见的文本编辑器,今天我来谈谈Vim 可视模式。
608 0
详解 Vim 三种模式之一:可视模式
|
机器学习/深度学习 算法
数据结构与算法关系(中):如何评判一个算法的好坏
大家好,我是MicroStone,一个曾在三家世界500强企业担任要职的一线互联网工程师。上一节,我们了解到算法的一些特征,想必大家都掌握了算法设计要求,在学习或工作中根据业务需求设计要设计一个算法,我们要如何评估一个算法的好坏呐?下面我们来看看算法的度量方式。
542 0
解决办法:C代码中明明有,为什么编译时提示未定义的引用
解决办法:C代码中明明有,为什么编译时提示未定义的引用
529 0