备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

请教一下为什么用用kafka的client可以正常消费数据，但是用flink消费kafka就报错？

请教一下为什么用用kafka的client可以正常消费数据，但是用flink消费kafka就报错？

展开

收起

爱喝咖啡嘿 2022-12-20 16:28:57 373 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

穿过生命散发芬芳

使用Flink消费kafka内的数据

package com.shujia.flink.kafka

import java.util.Properties

import org.apache.flink.api.common.serialization.SimpleStringSchema
import org.apache.flink.streaming.api.scala._
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer

object Demo1KafkaSource {
  def main(args: Array[String]): Unit = {
    //创建flink环境
    val env: StreamExecutionEnvironment = StreamExecutionEnvironment.getExecutionEnvironment

    val properties = new Properties()
    //broler地址列表
    properties.setProperty("bootstrap.servers", "master:9092,node1:9092,node2:9092")
    //消费者组，同一条数据在一个组内只处理一次
    properties.setProperty("group.id", "test")

    //创建消费者
    val flinkKakfaConsumer = new FlinkKafkaConsumer[String](
      "words", //指定topic
      new SimpleStringSchema(), //指定数据格式
      properties //指定配置文件对象
    )

    flinkKakfaConsumer.setStartFromEarliest() //尽可能从最早的记录开始
    //flinkKakfaConsumer.setStartFromLatest() //从最新的记录开始
    //flinkKakfaConsumer.setStartFromTimestamp() //从指定的时间开始（毫秒）
    //flinkKakfaConsumer.setStartFromGroupOffsets()  //默认的方法, 按照消费者组读取数据，如果消费者组第一次使用，默认只读取最新的数据

    //使用kafka source   -- 无界流
    val kafkaDS: DataStream[String] = env.addSource(flinkKakfaConsumer)
    kafkaDS
      .flatMap(_.split(","))
      .map((_, 1))
      .keyBy(_._1)
      .sum(1)
      .print()

    env.execute()
  }
}

2022-12-20 23:40:36

赞同展开评论

问答分类：

消息中间件 Kafka 流计算云消息队列 Kafka 版实时计算 Flink版

问答标签：

云消息队列 Kafka 版flink 实时计算 Flink版报错实时计算 Flink版kafka 实时计算 Flink版数据云消息队列 Kafka 版报错

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

消息队列Kafka版客户端报错InvalidSessionTimeoutException

217

1

0

消息队列Kafka版扩容报错ip not enough

124

1

0

flink cdc实时同步oracle数据库到kafka报错

314

2

0

flinkcdc kafka 消费报错？

94

0

0

kafka client生产datahub消息，topic如何使用？

187

1

0

kafka client 生产 datahub 消息 topic 使用方法有哪些？

89

0

0

消息队列Kafka发消息报错CORRUPT_MESSAGE

562

1

0

Flink消费kafka报错Timeout of 60000ms expired before...

1170

1

0

使用高版本(3.X)的SDK连接消息队列Kafka版实例会报错

104

1

0

Kafka调用API接口报错AuthenticationException

97

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

语音通知

RocketMQ：底层Netty频繁OS OOM

OOM排查之路：一次曲折的线上故障复盘

AI 原生应用开源开发者沙龙·杭州站精彩回顾 & PPT 下载

从这张年度技术力量榜单里，看见阿里云从云原生到 AI 原生的进化能力和决心

热门讨论

热门文章

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

flink cdc同步的源表，一定要有主键么？

flink cdc source端能降低消费速度嘛？

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

请问一下Flink mysqlcdc获取到数据之后关联结果不更新这个怎么办?

flink datastream ，向clickhouse插入数据时怎么关闭插入时更新,

Flink CDC有知道Mac m1下的docker 环境如何开启sqlserver代理吗？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

展开全部

还有其他疑问?