1175223700484759_个人页

1175223700484759

文章

问答

视频

个人介绍

暂无个人介绍

擅长的技术

大数据开发

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

发表了文章 2023-07-29

大数据面试题：Hive count(distinct)有几个reduce，海量数据会有什么问题

count(distinct)只有1个reduce。为什么只有一个reducer呢，因为使用了distinct和count(full aggreates)，这两个函数产生的mr作业只会产生一个reducer，而且哪怕显式指定set mapred.reduce.tasks=100000也是没用的。当使用count(distinct)处理海量数据（比如达到一亿以上）时，会使得运行速度变得很慢，熟悉mr原理的就明白这时sql跑的慢的原因，因为出现了很严重的数据倾斜。
发表了文章 2023-07-16

《阿里大数据之路》读书笔记：总述

阿里数据体系主要分为数据采集、数据计算、数据服务和数据应用四大层次。
发表了文章 2023-07-04

《阿里大数据之路》读书笔记：第二章日志采集

《阿里大数据之路》读书笔记：第二章日志采集
发表了文章 2023-01-28

阿里云大数据开发三面面经，已过，面试题已配答案

阿里云大数据开发三面面经，已过，面试题已配答案
发表了文章 2022-10-30

阿里云大数据开发二面面经，已过，面试题已配答案

阿里云大数据开发一面面经，已过，面试题已配答案
发表了文章 2022-10-21

阿里云大数据开发一面面经，已过，面试题已配答案

阿里云大数据开发一面面经，已过，面试题已配答案
发表了文章 2022-10-17

数据仓库面试题——介绍下数据仓库

对数据仓库的一些概念总结，对比数据库、数据湖有什么区别
发表了文章 2022-09-29

数据仓库面试题——数据仓库分层

数据仓库分层
发表了文章 2022-09-29

大数据开发（牛客）面试被问频率最高的几道面试题

大数据开发（牛客）面试被问频率最高的几道面试题
发表了文章 2022-09-29

大数据面试题V3.0，523道题，779页，46w字

大数据面试题V3.0，523道题，779页，46w字
发表了文章 2022-09-29

大数据面试题：介绍下Kafka，Kafka的作用？Kafka的组件？适用场景？

Kafka的作用？Kafka的组件？适用场景？
发表了文章 2022-09-29

数据仓库面试知识总结

数据仓库面试知识总结

暂无更多信息

发表了文章 2023-07-29

大数据面试题：Hive count(distinct)有几个reduce，海量数据会有什么问题
发表了文章 2023-07-16

《阿里大数据之路》读书笔记：总述
发表了文章 2023-07-04

《阿里大数据之路》读书笔记：第二章日志采集
发表了文章 2023-01-28

阿里云大数据开发三面面经，已过，面试题已配答案
发表了文章 2022-10-30

阿里云大数据开发二面面经，已过，面试题已配答案
发表了文章 2022-10-21

阿里云大数据开发一面面经，已过，面试题已配答案
发表了文章 2022-10-17

数据仓库面试题——介绍下数据仓库
发表了文章 2022-09-29

数据仓库面试题——数据仓库分层
发表了文章 2022-09-29

大数据开发（牛客）面试被问频率最高的几道面试题
发表了文章 2022-09-29

大数据面试题V3.0，523道题，779页，46w字
发表了文章 2022-09-29

大数据面试题：介绍下Kafka，Kafka的作用？Kafka的组件？适用场景？
发表了文章 2022-09-29

数据仓库面试知识总结

正在加载, 请稍后...

滑动查看更多

回答了问题 2023-01-30

2023，社区讨论聊什么？话题由你定！

Flink

赞0 踩0 评论0
回答了问题 2022-10-17

23届秋招，你怎么看？

自己秋招那会还是19年了，后续工作了，也有了自己的知识分享平台、交流群（现在两个群）等，也有很多小伙伴跟着我当年的学习路线、我整理的面试题（大数据开发）拿到了大厂offer。其实这些拿到offer的同学都有一个共同点，愿意去学，愿意去“吃苦”，有的甚至半年左右就完成了培训班一年的课程，还包括导师安排的任务，这些同学相比于等到要找工作才想起些什么的人来说，他们的思想更成熟一些，很多读书的目的就是为了找一份好工作，目的明确，学习途中有一颗比较坚定的心，这就够了，相比于大多数人，已经是走在了前面，经过一番努力，无论是在什么行情下，找到一份满意的工作，基本上是不成问题的。借用当时在niuke上发的一段话，以此共勉。

赞0 踩0 评论0

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

1175223700484759_个人页

个人介绍

擅长的技术

大数据面试题：Hive count(distinct)有几个reduce，海量数据会有什么问题

《阿里大数据之路》读书笔记：总述

《阿里大数据之路》读书笔记：第二章 日志采集

阿里云大数据开发三面面经，已过，面试题已配答案

阿里云大数据开发二面面经，已过，面试题已配答案

阿里云大数据开发一面面经，已过，面试题已配答案

数据仓库面试题——介绍下数据仓库

数据仓库面试题——数据仓库分层

大数据开发（牛客）面试被问频率最高的几道面试题

大数据面试题V3.0，523道题，779页，46w字

大数据面试题：介绍下Kafka，Kafka的作用？Kafka的组件？适用场景？

数据仓库面试知识总结

大数据面试题：Hive count(distinct)有几个reduce，海量数据会有什么问题

《阿里大数据之路》读书笔记：总述

《阿里大数据之路》读书笔记：第二章 日志采集

阿里云大数据开发三面面经，已过，面试题已配答案

阿里云大数据开发二面面经，已过，面试题已配答案

阿里云大数据开发一面面经，已过，面试题已配答案

数据仓库面试题——介绍下数据仓库

数据仓库面试题——数据仓库分层

大数据开发（牛客）面试被问频率最高的几道面试题

大数据面试题V3.0，523道题，779页，46w字

大数据面试题：介绍下Kafka，Kafka的作用？Kafka的组件？适用场景？

数据仓库面试知识总结

2023，社区讨论聊什么？话题由你定！

23届秋招，你怎么看？

《阿里大数据之路》读书笔记：第二章日志采集

《阿里大数据之路》读书笔记：第二章日志采集