CreateDirectStream 消费数据|学习笔记-阿里云开发者社区

CreateDirectStream 消费数据|学习笔记

2022-11-16 225

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习 CreateDirectStream 消费数据

开发者学堂课程【大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）：CreateDirectStream 消费数据】学习笔记与课程紧密联系，让用户快速学习知识

课程地址：https://developer.aliyun.com/learning/course/670/detail/11627

CreateDirectStream 消费数据

内容介绍：

一、CreateDirectStream 消费数据的步骤

二、CreateDirectStream 的代码实现

一、CreateDirectStream 消费数据的步骤

目标：掌握CreateDirectStream 消费数据的步骤

1、创建Spark conf

2、创建SparkContext

3、创建Streaming Context

4、读取kafka 内的数据ssc,kafkaParams,topics)

5、消费数据

6、开启 Streaming 任务+开启循环

二、CreateDirectStream 的代码实现

来到开发环境中，打开 ispider 并将其中的 main 关掉，找到test ，右键点击 scala 后，将复制出的CreateDirectStream 新建到Scala 的Object ，输入TestCreateDirectStream。

接下来处理消费数据的整个流程，用CreateDirectStream 的方法来读取并消费。

如下：

1、程序的入口

首先看代码逻辑，要执行该操作，就要创建出一个main 方法。

object TestCreateDirectStream {

//程序的入口

def main(args: Array[string]): Unit = {

//1、创建 spark conf

valconf=newSparkConf().setMaster("local[2]").setAppName ("TestCreateDirectstream")

//2、创建 SparkContext

val sc=new SparkContext(conf)

//3、创建 streaming Context

val ssc=new StreamingContext(sc,Seconds(2))

//4、读取 kafka 内的数据 ssc,kafkaParams,topics)

KafkaUtils.createDirectstream()

//其中 createDirectstream() 会爆红，因为createDirectstream() 中需要很多参数，但实际里面没有参数。

查看缺的参数需要按ctrl ，会出现很多用法。需要用到（其中Class 参数是无用的）：

def createDirectStream [K, V, KD <: Decoder[K], VD <: Decoder[V]](

jssc: JavaStreamingContext,

keyClass: Class[K],

valueClass: Class[V],

keyDecoderClass: Class[KD],

valueDecoderClass: Class[VD],

kafkaParams: JMap[String, String],

topics: JSet[String]

//实例kafkaParams

val kafkaParams = Map ("bootstrap.servers "->" 192.168.100.100:9092,192.168.100.110:9092,192.168.100.120:9092")

//实例 topics

val topics=Set("test01")

//接收数据

val kafkaDatas = KafkaUtils.createDirectStream [String,String,StringDecoder,StringDecoder](ssc,kafkaParams,topics)

//只获取value 数据

val kafkaValue=kafkaDatas.map(_._2)

//5、消费数据

kafkaValue.foreachRDD(rdd=>rdd.foreach(println))

//6、开启 streaming 任务+开启循环

ssc.start()

ssc.awaitTermination()

CreateDirectStream 消费数据|学习笔记

CreateDirectStream 消费数据

一、CreateDirectStream 消费数据的步骤

二、CreateDirectStream 的代码实现

阿里云开发者学堂

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

CreateDirectStream 消费数据|学习笔记

CreateDirectStream 消费数据

一、CreateDirectStream 消费数据的步骤

二、CreateDirectStream 的代码实现

阿里云开发者学堂

热门文章

最新文章

相关电子书