MaxComputer-Pyodps之mysql ddl 批量生成odps ddl

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 批量将mysql 的DDL语句转化为odps ddl,潦草之作,可用即可。。。

系统环境:windows 64 位
python版本:2.7
Maxcomputer(原ODPS)

----- 1、安装python2.7(略过,百度一下就可以)

----- 2、安装MySQLdb模块
windows下个人习惯pip 安装 whl文件,虽然不是所有都能顺利安装,但是大部分还是可以的。
下载地址:
https://www.lfd.uci.edu/~gohlke/pythonlibs/#mysql-python

image

下载到本地后,cmd进入dos环境,可以直接切换到下载目录,直接使用命令 pip install mysqlclient-1.3.13-cp27-cp27m-win_amd64.whl 或者pip-script.py install mysqlclient-1.3.13-cp27-cp27m-win_amd64.whl

编译方法:
1、创建个xxx.py的文件,进入dos,切换到py文件路径:python xxx.py

2、使用编译工具:PyCharm、Maxcomputer Studio等工具执行

    #!/usr/bin/python
    # -*- coding: UTF-8 -*-
    # author:zhy

    import MySQLdb
    #####   mysql数据库配置
    def exec_sql(sql):
        conn=MySQLdb.connect(host='数据库地址',user='用户',passwd='密码',db=TABLE_SCHEMA,charset='utf8')
        cursor = conn.cursor()
        cursor.execute(sql)
        rows = cursor.fetchall()
        cursor.close()
        conn.close()
        return rows
    
    #### schema
    TABLE_SCHEMA='mysql'   # mysql数据库元数据库
    sys_id='s01'                      # ods入edw规范:表名+前缀
    target_schema='odps_project'  #odps对应项目名称
    
    ##### 获取mysql表名
    sql='''
        select table_name 
        from information_schema.`TABLES`
        where TABLE_SCHEMA='%s'
        and table_type='BASE TABLE'
    '''%TABLE_SCHEMA
    
    exec_relusts=exec_sql(sql)   # sql执行结果为二维

    out_comment=''    # 定义输出参数
    ###以下并不包含所有mysql字段类型的转换
    for i in exec_relusts:
        TABLE_NAME = i[0]
        print TABLE_NAME
        sql='''
                select
                     TABLE_NAME
                    ,COLUMN_NAME
                    ,case when DATA_TYPE in ('varchar','char','date','longtext','text') then 'string'
                          when DATA_TYPE in ('float') then 'double'
                          when DATA_TYPE = 'tinyint' then 'int'
                          when DATA_TYPE = 'timestamp' then 'datetime'
                          else DATA_TYPE
                     end as DATA_TYPE
                    ,COLUMN_COMMENT
    
                from information_schema.`COLUMNS`
                where TABLE_SCHEMA = '%s'
                and TABLE_NAME = '%s'
                order by TABLE_NAME,ORDINAL_POSITION
             '''%(TABLE_SCHEMA,TABLE_NAME)
    
        rows=exec_sql(sql)
        sql='''
        show create table %s.%s
        '''%(TABLE_SCHEMA,TABLE_NAME)
    
        sql_exec_result= exec_sql(sql)
        ddl_info0= sql_exec_result[0][1]
        if ddl_info0.find('COMMENT=')>1:
            ddl_table_common = ddl_info0[ddl_info0.index("COMMENT="):]
            ddl_table_common= ddl_table_common.replace('=',' ')
        else:
            ddl_table_common="COMMENT ''"
    
        ddl_info='CREATE TABLE IF NOT EXISTS %s.%s_%s (\n'%(target_schema,sys_id,TABLE_NAME)
    
        for row in rows:
            row3=row[3].replace('\r\n','\\r\\n')
            row3=row3.replace('\n','\\n')
            ddl_info=ddl_info+ str(row[1]).upper()+' '+row[2].upper()+' '+"COMMENT'"+ row3+"'\n,"
    
        ddl_info=ddl_info+')'
        ddl_info=ddl_info.replace(')',')')        
        ddl_info=ddl_info+'\n'+ddl_table_common+"\nPARTITIONED BY (PT STRING COMMENT '数据日期')".decode('utf-8')  #如不需分区,需修改
    
        out_comment= out_comment+'-- '+TABLE_NAME +'\n'+ddl_info +'\n;\n'
    
    # print out_comment   
    # 将DDL语句输出到文件
    Output_File=r'D:\data\output'+'\\'+sys_id+'_'+TABLE_SCHEMA+'.sql'
    file_w=file(Output_File,"w")
    file_w.write(out_comment.encode("utf-8"))
    file_w.close()
相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
4月前
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
66 3
|
13天前
|
SQL 监控 关系型数据库
MySQL如何优雅的执行DDL
在MySQL中优雅地执行DDL操作需要综合考虑性能、锁定和数据一致性等因素。通过使用在线DDL工具、分批次执行、备份和监控等最佳实践,可以在保障系统稳定性的同时,顺利完成DDL操作。本文提供的实践和案例分析为安全高效地执行DDL操作提供了详细指导。
28 14
|
4月前
|
消息中间件 分布式计算 关系型数据库
大数据-140 - ClickHouse 集群 表引擎详解5 - MergeTree CollapsingMergeTree 与其他数据源 HDFS MySQL
大数据-140 - ClickHouse 集群 表引擎详解5 - MergeTree CollapsingMergeTree 与其他数据源 HDFS MySQL
77 0
|
4月前
|
消息中间件 关系型数据库 MySQL
大数据-117 - Flink DataStream Sink 案例:写出到MySQL、写出到Kafka
大数据-117 - Flink DataStream Sink 案例:写出到MySQL、写出到Kafka
320 0
|
3月前
|
SQL DataWorks 关系型数据库
阿里云 DataWorks 正式支持 SelectDB & Apache Doris 数据源,实现 MySQL 整库实时同步
阿里云数据库 SelectDB 版是阿里云与飞轮科技联合基于 Apache Doris 内核打造的现代化数据仓库,支持大规模实时数据上的极速查询分析。通过实时、统一、弹性、开放的核心能力,能够为企业提供高性价比、简单易用、安全稳定、低成本的实时大数据分析支持。SelectDB 具备世界领先的实时分析能力,能够实现秒级的数据实时导入与同步,在宽表、复杂多表关联、高并发点查等不同场景下,提供超越一众国际知名的同类产品的优秀性能,多次登顶 ClickBench 全球数据库分析性能排行榜。
|
3月前
|
SQL 关系型数据库 MySQL
|
4月前
|
SQL 关系型数据库 MySQL
MySQL 更新1000万条数据和DDL执行时间分析
MySQL 更新1000万条数据和DDL执行时间分析
276 4
|
6月前
|
存储 JSON 关系型数据库
MySQL与JSON的邂逅:开启大数据分析新纪元
MySQL与JSON的邂逅:开启大数据分析新纪元
|
6月前
|
关系型数据库 MySQL 大数据
教你使用Python玩转MySQL数据库,大数据导入不再是难题!
教你使用Python玩转MySQL数据库,大数据导入不再是难题!
144 1
|
6月前
|
分布式计算 DataWorks 关系型数据库
DataWorks产品使用合集之ODPS数据怎么Merge到MySQL数据库
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。