Spark的搜索结果_第3页-阿里云开发者社区

青云交（Java大数据AI云原生Python）

|

5月前

|

博文

|

来自：大数据与机器学习

Java 大视界 -- Java 大数据在智能建筑能耗监测与节能策略制定中的应用（182）

本文探讨了Java大数据技术在智能建筑能耗监测与节能策略制定中的关键应用。通过Hadoop、Spark等技术实现能耗数据的存储、分析与可视化，结合实际案例，展示了Java大数据如何助力建筑行业实现节能减排目标。

# 云原生大数据计算服务 MaxCompute # 存储 # 分布式计算 # Java # 大数据 # Spark

游客34daw2pu72xsc

|

5月前

|

问答

|

来自：大数据与机器学习

spark写maxcomputer报错string length133333largethanmax

# 云原生大数据计算服务 MaxCompute # 分布式计算 # Spark

刘大猫.

|

5月前

|

博文

|

来自：大数据与机器学习

springboot项目集成dolphinscheduler调度器可拖拽spark任务管理

# 分布式计算 # Java # 大数据 # 调度 # Spark

Echo_Wish

|

5月前

|

博文

|

来自：大数据与机器学习

你以为大数据只是存？其实真正的“宝藏”藏在这招里——数据挖掘！

# 云原生大数据计算服务 MaxCompute # SQL # 分布式计算 # 数据挖掘 # 大数据 # Spark

游客wkqymr43luqiu

|

5月前

|

博文

|

来自：大数据与机器学习

Spark SQL架构及高级用法

Spark SQL基于Catalyst优化器与Tungsten引擎，提供高效的数据处理能力。其架构涵盖SQL解析、逻辑计划优化、物理计划生成及分布式执行，支持复杂数据类型、窗口函数与多样化聚合操作，结合自适应查询与代码生成技术，实现高性能大数据分析。

# SQL # JSON # 分布式计算 # Spark # 数据格式

Echo_Wish

|

6月前

|

博文

|

来自：大数据与机器学习

别再云里雾里了！一文带你整明白Hadoop生态到底是啥玩意儿

# SQL # 分布式计算 # Hadoop # HIVE # Spark

大熊计算机

|

6月前

|

博文

|

来自：大数据与机器学习

用 Spark 优化亿级用户画像计算：Delta Lake 增量更新策略详解

在亿级用户画像计算中，传统全量更新面临数据量大、更新频繁、延迟敏感等挑战。本文详解如何结合 Spark 与 Delta Lake 实现高效增量更新，通过仅处理变化数据，显著降低资源消耗并提升实时性，助力构建高性能用户画像系统。

# JSON # 分布式计算 # 搜索推荐 # Spark # 数据格式

青云交（Java大数据AI云原生Python）

|

6月前

|

博文

|

来自：大数据与机器学习

Java 大视界 —— 基于 Java 的大数据分布式计算在气象数据处理与天气预报中的应用进展（176）

本文围绕基于 Java 的大数据分布式计算在气象数据处理与天气预报中的应用展开，剖析行业现状与挑战，阐释技术原理，介绍其在数据处理及天气预报中的具体应用，并结合实际案例展示实施效果。

# 云原生大数据计算服务 MaxCompute # 分布式计算 # Java # 大数据 # 数据处理 # Spark

游客2cgvtedhdpwze

|

6月前

|

博文

19章构建企业级大数据平台：从架构设计到数据治理的完整链路

开源社区：贡献者路径：从提交Issue到成为Committer 会议演讲：通过DataWorks Summit提升影响力标准制定：白皮书撰写：通过DAMA数据治理框架认证专利布局：通过架构设计专利构建技术壁垒

# 云原生大数据计算服务 MaxCompute # 存储 # SQL # 分布式计算 # 数据安全/隐私保护 # Spark

大熊计算机

|

6月前

|

博文

|

来自：大数据与机器学习

大数据≠大样本：基于Spark的特征降维实战（提升10倍训练效率）

本文探讨了大数据场景下降维的核心问题与解决方案，重点分析了“维度灾难”对模型性能的影响及特征冗余的陷阱。通过数学证明与实际案例，揭示高维空间中样本稀疏性问题，并提出基于Spark的分布式降维技术选型与优化策略。文章详细展示了PCA在亿级用户画像中的应用，包括数据准备、核心实现与效果评估，同时深入探讨了协方差矩阵计算与特征值分解的并行优化方法。此外，还介绍了动态维度调整、非线性特征处理及降维与其他AI技术的协同效应，为生产环境提供了最佳实践指南。最终总结出降维的本质与工程实践原则，展望未来发展方向。

# 云原生大数据计算服务 MaxCompute # 人工智能 # 分布式计算 # 大数据 # 数据挖掘 # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark