备案控制台

开发者社区微服务文章正文

Blink流式计算-Kafka接入demo

2020-01-10 1586

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

实时计算 Flink 版，5000CU*H 3个月

简介： //定义解析Kakfa message的UDTF CREATE FUNCTION myParse AS 'com.xxxxxx.MyKafkaUDTF'; CREATE FUNCTION myUdf AS 'com.xxxxxxx.MyWaterMarkUDTF'; //注意：kafka源表DDL字段必须与以下例子一致 create table my_input (

//定义解析Kakfa message的UDTF

CREATE FUNCTION myParse AS 'com.xxxxxx.MyKafkaUDTF';

CREATE FUNCTION myUdf AS 'com.xxxxxxx.MyWaterMarkUDTF';

//注意：kafka源表DDL字段必须与以下例子一致

create table my_input (

messageKey VARBINARY,

message VARBINARY,

topic varchar,

partition int,

offset bigint,

ctTime AS TO_TIMESTAMP (myUdf (message)),

//注意计算里的类型必须为timestamp才能在做watermark。

WATERMARK wk FOR ctTime AS WITHOFFSET (ctTime, 2000) --为rowtime定义watermark

) WITH (

type = 'KAFKA08',

topic = 'myTopic',

group.id = 'mGroup',

extraConfig = 'bootstrap.servers=127.0.0.1:9092',

zookeeper.connect = '127.0.0.1:2181',

startupMode = 'EARLISET'

);

-- 滚动窗口 group by prodId

CREATE VIEW input_view01 (

windowStart,

windowEnd,

prodId,

prodName,

prodNumber

) AS

SELECT

HOP_START (S.ctTime, INTERVAL '30' SECOND, INTERVAL '2' MINUTE),

HOP_END (S.ctTime, INTERVAL '30' SECOND, INTERVAL '2' MINUTE),

T.prodId as prodId,

T.prodName as prodName,

count (*) as prodNumber

from

my_input as S,

LATERAL TABLE (myParse (message)) as T (

id,

prodId,

prodName,

createdAt,

updatedAt

)

Group BY HOP (S.ctTime, INTERVAL '30' SECOND, INTERVAL '2' MINUTE), T.prodId, T.prodName;

CREATE VIEW input_view60 (

id,

prodId,

prodName,

createdAt,

updatedAt

) AS

SELECT

T.id,

T.prodId,

T.prodName,

T.createdAt,

T.updatedAt

from

my_input as S,

LATERAL TABLE (myParse (message)) as T (

id,

goCs,

prodId,

prodName,

createdAt,

updatedAt

);

-- 结果print

create table outprint01(

prodId bigint,

prodName varchar,

prodNumber bigint

)with(

type = 'print'

);

insert into outprint01

select prodId , prodName , prodNumber

from input_view01;

-- 结算结果写入Kafka

create table result_kafka (

messageKey VARBINARY,

message VARBINARY,

PRIMARY KEY (messageKey)

) with (

type = 'KAFKA08',

topic = 'myResultTopic',

extraConfig='bootstrap.servers=127.0.0.1:9092',

zookeeper.connect = '127.0.0.1:2181',

startupMode='EARLISET'

);

//此处的结果输出，可以考虑将结果组装成字符串，中间用|隔开，接收方再解析

INSERT INTO

result_kafka

SELECT

cast(prodId as VARBINARY) as messageKey,

cast(prodName as VARBINARY) as message

FROM

input_view01;

MyKafkaUDTF写法：

package com.xxxxxxxx;

import com.alibaba.fastjson.JSONObject;

import org.apache.flink.table.functions.TableFunction;

import org.apache.flink.table.types.DataType;

import org.apache.flink.table.types.DataTypes;

import org.apache.flink.types.Row;

import java.io.UnsupportedEncodingException;

import java.sql.Timestamp;

public class MyKafkaUDTF extends TableFunction {

public void eval(byte[] message) {

try {

String msg = new String(message, "UTF-8");

System.out.println("收到的消息:"+msg);

try {

JSONObject jsonObject = JSONObject.parseObject(msg);

if (jsonObject != null) {

//id

Long id = jsonObject.getLong("id");

//prodId

Long prodId = jsonObject.getLong("prodId");

//prodName

String prodName = jsonObject.getString("prodName ");

Long createAt = jsonObject.getLong("createdAt");

Long updatedAt = jsonObject.getLong("updatedAt");

//创建时间时间戳

Timestamp createAtTimeStamp = new Timestamp(createAt);

Timestamp updatedAtTimeStamp = new Timestamp(updatedAt);

Row row = new Row(8);

row.setField(0, id);

row.setField(1, prodId);

row.setField(2, prodName);

row.setField(3, createAtTimeStamp );

row.setField(4, updatedAtTimeStamp );

System.out.println("message str ==>" + row.toString());

collect(row);

}

} catch (Exception e) {

e.printStackTrace();

System.out.println(" error. Input data " + msg + "is not json string");

}

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

}

}

@Override

// 如果返回值是Row，就必须重载实现这个方法，显式地告诉系统返回的字段类型

public DataType getResultType(Object[] arguments, Class[] argTypes) {

return DataTypes.createRowType(

DataTypes.LONG,

DataTypes.LONG,

DataTypes.STRING,

DataTypes.TIMESTAMP,

DataTypes.TIMESTAMP);

}

}

package xxxxxxx;

import com.alibaba.fastjson.JSONObject;

import org.apache.flink.table.functions.ScalarFunction;

import java.text.SimpleDateFormat;

import java.util.Date;

public class MyWaterMarkUDTF extends ScalarFunction {

public String eval(byte[] message) {

try {

String msg = new String(message, "UTF-8");

JSONObject data = JSONObject.parseObject(msg);

System.out.println("time:"+data.getString("createdAt"));

Long createAtLong = data.getLong("createdAt");

SimpleDateFormat parser = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

String createTimeStr = parser.format(new Date(createAtLong));

return createTimeStr;

} catch (Exception e) {

e.printStackTrace();

}

return null;

}

//可选，close方法可以不写

@Override

public void close() {

}

}

文章标签：

云消息队列 Kafka 版

实时计算 Flink版

消息中间件

流计算

SQL

Kafka

数据格式

JSON

关键词：

计算云消息队列 Kafka 版

云消息队列 Kafka 版demo

blink云消息队列 Kafka 版

云消息队列 Kafka 版接入

云消息队列 Kafka 版流式计算

sk_zard

目录

相关文章

诸葛子房

|

8月前

|

消息中间件 Java Kafka

kafka入门demo

kafka入门demo

诸葛子房

86 0 0

NBI大数据可视化

|

消息中间件数据可视化关系型数据库

（3）sparkstreaming从kafka接入实时数据流最终实现数据可视化展示

1）我们通过kafka与各个业务系统的数据对接，将各系统中的数据实时接到kafka； 2）通过sparkstreaming接入kafka数据流，定义时间窗口和计算窗口大小，业务计算逻辑处理； 3）将结果数据写入到mysql； 4）通过可视化平台接入mysql数据库，这里使用的是NBI大数据可视化构建平台； 5）在平台上通过拖拽式构建各种数据应用，数据展示；

NBI大数据可视化

493 0 0

（3）sparkstreaming从kafka接入实时数据流最终实现数据可视化展示

武子康

|

3月前

|

消息中间件 Java Kafka

Flink-04 Flink Java 3分钟上手 FlinkKafkaConsumer消费Kafka数据进行计算SingleOutputStreamOperatorDataStreamSource

Flink-04 Flink Java 3分钟上手 FlinkKafkaConsumer消费Kafka数据进行计算SingleOutputStreamOperatorDataStreamSource

武子康

68 1 1

一只牛博

|

7月前

|

消息中间件网络协议 Java

springboot+netty+kafka实现设备信息收集(完整demo复制可用)

springboot+netty+kafka实现设备信息收集(完整demo复制可用)

一只牛博

111 0 0

sunrr

|

消息中间件分布式计算 Kafka

将Apache Flink任务实时消费Kafka窗口的计算改为MaxCompute

将Apache Flink任务实时消费Kafka窗口的计算改为MaxCompute

sunrr

149 6 10

哒哒说Java

|

消息中间件 Java Kafka

Kafka+Avro的demo

Kafka+Avro的demo

哒哒说Java

169 0 0

小攻云攻略

|

消息中间件存储弹性计算

基于Kafka connect+函数计算的轻量计算解决方案

Kafka ETL基于kafka connect加函数计算，为云上用户提供了一套数据流转加数据计算的一站式解决方案。

小攻云攻略

728 0 1

云祁

|

消息中间件存储分布式计算

【Kafka】（十五）流式计算 Kafka Streams 架构深入2

【Kafka】（十五）流式计算 Kafka Streams 架构深入2

云祁

770 0 0

云祁

|

消息中间件存储分布式计算

【Kafka】（十五）流式计算 Kafka Streams 架构深入1

【Kafka】（十五）流式计算 Kafka Streams 架构深入1

云祁

749 0 0

石臻臻的杂货铺

|

消息中间件运维安全

Kafka的灵魂伴侣Logi-KafkaManger(1)之集群的接入及相关概念讲解

Kafka的灵魂伴侣Logi-KafkaManger(1)之集群的接入及相关概念讲解

石臻臻的杂货铺

192 0 0

Kafka的灵魂伴侣Logi-KafkaManger(1)之集群的接入及相关概念讲解

热门文章

最新文章

【手把手教你Linux环境下快速搭建Kafka集群】内含脚本分发教程，实现一键部署多个Kafka节点

【Azure Event Hub】Kafka消息发送失败(Timeout Exception)

2024消息队列“四大天王”：Rabbit、Rocket、Kafka、Pulsar巅峰对决

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

2024最全Kafka集群方案汇总

招行面试：RocketMQ、Kafka、RabbitMQ，如何选型？

云消息队列 Kafka 版 V3 系列荣获信通院“云原生技术创新标杆案例”

解决kafka集群由于默认的__consumer_offsets这个topic的默认的副本数为1而存在的单点故障问题

SQLServer CDC数据通过Kafka connect实时同步至分析型数据库 AnalyticDB For PostgreSQL及OSS

springboot配置kafka生产者和消费者详解

Kafka 线程模型痛点攻克：提升分区写入 2 倍性能

spring kafka的问题集锦

【消息中心】kafka消费失败重试10次的问题

Kafka Exactly Once 语义实现原理：幂等性与事务消息

Kafka 迁移工具 MirrorMaker2 原理起底

一文搞懂 Kafka consumer 与 broker 交互机制与原理

Kafka消息队列原理及应用详解

扒开kafka内部组件，咱瞅一瞅都有啥？

DataWorks操作报错合集之通过dataworks把表数据发送到kafka，表字段全是string类型如何解决

人工智能平台PAI 操作报错合集之pyalink 1.6.1StreamOperator.fromDataframe(out_df, out_schema_str)之后直接连kafka sink会报下面的错误如何解决

相关课程

更多

消息队列Kafka入门课程

分布式消息系统 Kafka 快速入门

基于Flink的实时大数据应用Demo

实时数据接入：5分钟上手 Flink MySQL 连接器

实时计算 Flink 版产品入门与实操

分布式协调系统 Zookeeper 快速入门

相关电子书

更多

Java Spring Boot开发实战系列课程【第16讲】：Spring Boot 2.0 实战Apache Kafka百万级高并发消息中间件与原理解析

MaxCompute技术公开课第四季之如何将Kafka数据同步至MaxCompute

消息队列kafka介绍

相关实验场景

更多

基于Hologres+Flink搭建GitHub实时数据大屏

基于Flink+Tair搭建实时监控大屏

5分钟上手Flink MySQL连接器

使用Flink实时发现最热Github项目

RocketMQ一站式入门使用

下一篇

阿里云开通OSS存储服务详细流程