Spark的搜索结果_热门_第16页-阿里云开发者社区

岑玉海

|

博文

hbase源码系列（十五）终结篇&Scan续集-->如何查询出来下一个KeyValue

这是这个系列的最后一篇了，实在没精力写了，本来还想写一下hbck的，这个东西很常用，当hbase的Meta表出现错误的时候，它能够帮助我们进行修复，无奈看到3000多行的代码时，退却了，原谅我这点自私的想法吧。

# 云数据库HBase版 # 分布式数据库 # Hbase # 分布式计算 # Spark

james8888

|

博文

Kubernetes知识小普及

　　大部分概念Kubernete官网都有详细介绍，Kubernete中文官网 https://kubernetes.io/zh/docs/tutorials/kubernetes-basics/ 　　官网还提供一个比较好的功能是能在线互动，见互动教程，类似实操命令初步感受。

# 容器服务Kubernetes版 # 负载均衡 # 分布式计算 # Kubernetes # Spark # 容器 # Perl

那年的坏人

|

博文

spark源码分析之Checkpoint的过程

spark源码分析系列，spark版本1.5.2

# 分布式计算 # Spark # Hadoop # API

周志湖

|

博文

Machine Learning on Spark——第三节统计基础（一)

作者：周志湖微信号：zhouzhihubeyond 本文主要内容本文对了org.apache.spark.mllib.stat包及子包中的相关统计类进行介绍，stat包中包括下图中的类或对象: 本文将对其中的部分内容进行详细讲解获取矩阵列（column-wise）统计信息 Kernel density estimation（核密度估计) Hypothes

# 分布式计算 # Spark

阿里云实时计算Flink

|

博文

|

来自：大数据与机器学习

Hive 终于等来了 Flink

Flink 社区在集成 Hive 功能方面付出很多，目前进展也比较顺利，最近 Flink 1.10.0 RC1 版本已经发布，感兴趣的读者可以进行调研和验证功能。

# 实时计算 Flink版 # SQL # 分布式计算 # Apache # HIVE # 流计算 # Java # Hadoop # API # Maven # Spark

小猫吃鱼569

|

博文

【Spark Summit EU 2016】Glint: Spark的异步参数服务器

本讲义出自Rolf Jagerman在Spark Summit EU 2016上的演讲，主要介绍了Spark的异步参数服务器Glint，随着机器学习的数据量越来越多，其所生成的模型的规模也越来越大，于是就出现了模型大小已经超出了一台机器的内存的情况，于是就需要参数服务器来解决这一问题。

# 机器学习/深度学习 # 分布式计算 # Spark # MaxCompute # 大数据

anzhsoft

|

博文

从Storm和Spark 学习流式实时分布式计算的设计

# 云消息队列 MQ # 日志服务 # 微服务引擎 # 消息中间件 # 分布式计算 # 算法 # Spark # 流计算

云栖希望。

|

博文

Spark入门（Python版）

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 算法 # 大数据 # Spark # Python

祝威廉

|

博文

如何提高ElasticSearch 索引速度

这篇文章会讲述优化的几个参数的原理，以及一些其他的思路。

# 检索分析服务 Elasticsearch版 # 日志服务 # 分布式计算 # Spark # 索引 # 流计算 # API # Java # 监控 # 消息中间件 # Kafka # 存储

华章计算机

|

博文

《Spark大数据分析：核心概念、技术及实践》Scala编程

# 分布式计算 # Java # Scala # Spark # 索引

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark