【Hadoop Summit Tokyo 2016】重建大规模Web跟踪设施
本讲义出自Stephen Oakley在Hadoop Summit Tokyo 2016上的演讲,主要分享了Marketo的Web跟踪技术以及其合法的Web跟踪设施的架构设计以及相关法律问题,并对于Marketo的大规模Web跟踪基础设施的技术需求和业务需求进行了介绍,并且分享了在架构设计中使用到的Spark Streaming以及HBase等相关技术。
Flink关系型API简介
在接触关系型API之前,用户通常会采用DataStream、DataSet API来编写Flink程序,它们都提供了丰富的处理能力,以DataStream为例,它有如下这些优点:
富有表现力的流处理,包括但不限于:转换数据,更新状态,定义窗口、聚合,事件时间语义,有状态且保证正确性等;
高度自定义.