在SPARK SUMMIT 2017上,Jörg Schad,Distributed Systems Engineer分享了题为《Powering Predictive Mapping at Scale with Spark, Kafka, and Elastic Search》,就SMACK攻击,Mesos &DC/OS 概述,REAL-TIME TRACKING实例分析等方面的内容做了深入的分析。
https://yq.aliyun.com/download/2258?spm=a2c4e.11154804.0.0.1da06a79oC9KEQ
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在SPARK SUMMIT 2017上,Jörg Schad分享的演讲《Powering Predictive Mapping at Scale with Spark, Kafka, and Elastic Search》探讨了如何利用Spark、Kafka和Elastic Search等技术进行大规模预测性地图绘制。虽然您提及的"SMACK攻击"与Mesos似乎与原演讲主题不直接相关,但基于您的提问方向,我们可以聚焦于Spark、Kafka集成的关键点,这些内容在提供的知识库资料中有详细说明。
kafka_client_jaas.conf
和krb5.conf
文件以完成Kerberos认证。spark-submit --conf "spark.driver.extraJavaOptions=-Djava.security.auth.login.config={{PWD}}/kafka_client_jaas.conf -Djava.security.krb5.conf={{PWD}}/krb5.conf" \
--conf "spark.executor.extraJavaOptions=-Djava.security.auth.login.config={{PWD}}/kafka_client_jaas.conf -Djava.security.krb5.conf={{PWD}}/krb5.conf" \
--files /local/path/to/kafka_client_jaas.conf,/local/path/to/kafka.keytab,/local/path/to/krb5.conf \
--class xx.xx.xx.KafkaSample \
--num-executors 2 \
--executor-cores 2 \
--executor-memory 1g \
--master yarn-cluster \
xxx.jar arg1 arg2 arg3
此命令展示了如何通过spark-submit
提交作业时,配置必要的Java选项以支持Kerberos认证,并且指定了执行器资源参数。
对于Spark SQL,需指定包含Kafka DataSource的JAR包路径,并使用SQL DDL创建表来读取Kafka数据:
create table test_kafka
using loghub
options(
kafka.bootstrap.servers='...多个Kafka地址...',
subscribe='test_topic',
startingoffsets='earliest'
);
接着,您可以执行SQL查询来从test_kafka
表中读取消息。
/etc/hosts
文件包含了Kafka集群各节点的长域名和IP映射。kafka_client_jaas.conf
和krb5.conf
,并正确设置服务主体信息。以上步骤和注意事项概括了在阿里云E-MapReduce平台上,使用Spark Streaming或Spark SQL对接Kafka进行数据处理的关键流程。