【大数据】SparkSql连接查询中的谓词下推处理(一)
SparkSql 是架构在 Spark 计算框架之上的分布式 Sql 引擎,使用 DataFrame 和 DataSet 承载结构化和半结构化数据来实现数据复杂查询处理,提供的 DSL可以直接使用 scala 语言完成 Sql 查询,同时也使用 thriftserver 提供服务化的 Sql 查询功能。
科沃斯机器人基于阿里云Link的物联网应用的案例解读
科沃斯机器人股份有限公司CIO刘北京在2017年12月7日云栖大会苏州峰会上做了题为《智能改变生活》的主题演讲。作为机器人产业的明星企业,科沃斯机器人德国的市场占有率达到了34%,是德国所有扫地机器人的NO.1的产品。
数据中台的存储系统和计算平台枚举
采集&传输层
SqoopHadoop、关系型数据库之间传输数据的工具。传输时,会启动多个MR作业并发的传输数据
DataX阿里巴巴开源的数据同步工具,用来在各种异构数据源之间同步数据。
洞察数据,洞见未来——6.15流计算杭州峰会重磅来袭
阿里云流计算(Alibaba Cloud StreamCompute)是一个一站式、高性能、稳定、易用的流式大数据处理平台,通过它,您可以快速搭建具有亿级QPS处理能力的流式大数据系统。
流计算团队将于6月15日(13:10-17:00点)在西溪园区举办阿里云流计算杭州峰会,聚焦实时大数据处理,邀请阿里云流计算客户和阿里集团内客户深入分享基于阿里云进行大数据处理的解决方案、最佳实践、开发实战等内容,并侧重交流阿里云流计算产品以及业务场景,解决遇到的计算难题。