hive lock监控-阿里云开发者社区

hive lock监控

2017-11-14 1389

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

线上开启了hive的并发支持，因此job之间会有lock的竞争问题。

在产生锁的竞争时会有如下的信息：

conflicting lock present for table mode EXCLUSIVE

在一些场景下，有些job运行完毕但是不自动释放锁（需要手动unlock或者去zookeeper里面删除掉），因此需要对锁进行监控,主要是用show locks的信息。

具体的python脚本如下：

 
        import 
        os 
       
        import 
        subprocess 
       
        import 
        util 
       
        import 
        re 
       
        import 
        sendmail 
       
        import 
        time 
       
        import 
        sys 
       
        import 
        property 
       
        if 
        __name__ 
        =
        = 
        "__main__"
        : 
       
        allInfo 
        = 
        [] 
       
        now 
        = 
        time.time() 
       
        sql 
        = 
        "show locks" 
       
        lock_query_id 
        = 
        "" 
       
        lock_create_time 
        = 
        "" 
       
        lock_sql 
        = 
        "" 
       
        allLock 
        =  
        util.hive_run_cmd(sql) 
       
        for 
        line 
        in 
        allLock: 
       
        if 
        len
        (re.split(
        '\t| '
        ,line)[
        0
        ].split(
        '@'
        )) 
        =
        = 
        2
        : 
       
        dataBase 
        = 
        re.split(
        '\t| '
        ,line)[
        0
        ].split(
        '@'
        )[
        0
        ] 
       
        dataTable 
        = 
        re.split(
        '\t| '
        ,line)[
        0
        ].split(
        '@'
        )[
        1
        ] 
       
        lockType 
        = 
        re.split(
        '\t| '
        ,line)[
        -
        1
        ].strip() 
       
        print 
        dataBase
        + 
        "===" 
        + 
        dataTable 
        +  
        "===" 
        + 
        lockType 
       
        util.get_lock_info(allInfo,database
        =
        dataBase,table
        =
        dataTable,keytype
        =
        lockType) 
       
        else
        : 
       
        dataBase 
        = 
        re.split(
        '\t| '
        ,line)[
        0
        ].split(
        '@'
        )[
        0
        ] 
       
        dataTable 
        = 
        re.split(
        '\t| '
        ,line)[
        0
        ].split(
        '@'
        )[
        1
        ] 
       
        dataPartition 
        = 
        re.split(
        '\t| '
        ,line)[
        0
        ].split(
        '@'
        )[
        2
        ].replace(
        '/'
        ,
        ','
        ) 
       
        lockType 
        = 
        re.split(
        '\t| '
        ,line)[
        -
        1
        ].strip() 
       
        print 
        dataBase
        + 
        "===" 
        + 
        dataTable 
        +  
        "===" 
        + 
        lockType 
        + 
        "====" 
        + 
        dataPartition 
       
        util.get_lock_info(allInfo,database
        =
        dataBase,table
        =
        dataTable,keytype
        =
        lockType,partition
        =
        dataPartition) 
       
        print 
        allInfo 
       
        if 
        len
        (allInfo) 
        =
        = 
        0
        : 
       
        pass 
       
        #sys.exit(0) 
       
        else
        : 
       
        mailfile 
        = 
        open
        (
        "/home/hdfs/ericni/lock_monitor/mail/lock_table_"
        + 
        str
        (now) 
        + 
        ".html"
        ,
        "w+"
        ) 
       
        mailcontent 
        = 
        """ 
       
        <table  border=1> 
       
        <tr align="right" valign="middle"> 
       
        <th>TABLE</th><th>LOCK_TYPE</th><th>LOCK_TIME</th><th>QUERY_ID</th><th>SQL</th> 
       
        </tr> 
       
        """ 
       
        for 
        line 
        in 
        allInfo: 
       
        if 
        len
        (line) < 
        5
        : 
       
        pass 
       
        else
        : 
       
        re_table 
        = 
        line[
        0
        ] 
       
        re_type 
        = 
        line[
        1
        ] 
       
        re_time 
        = 
        float
        (now) 
        - 
        float
        (line[
        3
        ]) 
       
        print 
        re_time 
       
        re_query 
        = 
        line[
        2
        ] 
       
        re_sql 
        = 
        line[
        4
        ] 
       
        if 
        (re_time >
        = 
        1800  
        and 
        str
        (re_type) 
        =
        = 
        "SHARED"
        ) 
        or 
        (re_time >
        = 
        600 
        and 
        str
        (re_type) 
        =
        = 
        "EXCLUSIVE"
        ): 
       
        print 
        "++++++++++++++++++++++++++++++++++++++++++++++" 
       
        cmd 
        = 
        "/bin/touch /tmp/alert.file" 
       
        os.popen(cmd) 
       
        mailcontent 
        +
        = 
        """ 
       
        <tr align="right" valign="middle"> 
       
        <td>%s</td> 
       
        """ 
        % 
        (re_table) 
       
        mailcontent 
        +
        = 
        """ 
       
        <td>%s</td> 
       
        """  
        % 
        (re_type) 
       
        mailcontent 
        +
        = 
        """ 
       
        <td bgcolor='#F80000'>%s</td> 
       
        """  
        % 
        (
        round
        (
        float
        (re_time),
        2
        )) 
       
        mailcontent 
        +
        = 
        """ 
       
        <td>%s</td> 
       
        """  
        % 
        (re_query) 
       
        mailcontent 
        +
        = 
        """ 
       
        <td>%s</td> 
       
        """  
        % 
        (re_sql) 
       
        mailcontent 
        +
        = 
        "</tr>" 
       
        else
        : 
       
        pass 
       
        mailcontent 
        +
        = 
        "</table>" 
       
        mailfile.write(mailcontent) 
       
        if 
        not 
        os.path.isfile(
        "/tmp/alert.file"
        ): 
       
        print 
        "no need to alert" 
       
        sys.exit(
        0
        ) 
       
        else
        : 
       
        print 
        "+++______++++" 
       
        cmd 
        = 
        "/bin/rm -f /tmp/alert.file" 
       
        os.popen(cmd) 
       
        sendmail.send_mail_withoutSSL( 
        "HIVE table lock alert"
        ,mailcontent.encode(
        'utf-8'
        ),
        property
        .mail_list_hdfs)

产生的报警邮件如下：

本文转自菜菜光 51CTO博客，原文链接：http://blog.51cto.com/caiguangguang/1344439，如需转载请自行联系原作者

hive lock监控

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

hive lock监控

热门文章

最新文章

相关课程

相关电子书