《大数据分析原理与实践》——习题

简介: 本节书摘来自华章计算机《大数据分析原理与实践》一书中的第1章,习题,作者 王宏志,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

习题

  1. 在我们身边有哪些大数据?在这些大数据上有哪些分析任务?
  2. 比较“分析”“机器学习”和“数据挖掘”的异同。
  3. 比较电子商务和工业生产中大数据分析任务的异同。
  4. 在线电子商务网站(如淘宝、京东等)可以通过用户行为大数据进行分析以提高其销量,按照大数据分析的过程完成此大数据分析任务,其行为数据的模式可以从网站观察得到。
  5. 试论述大数据分析对大数据管理提出的新要求。
  6. 大数据分析对技术提出了何种挑战?根据你的经验论述这些挑战应当如何应对。
  7. 大数据分析中的“分析”和下面哪句话中的“分析”含义最相近?
    (1) “又於帝前聚米为山谷,指画形埶,开示众军所从道径往来,分析曲折,昭然可晓。”(《后汉书·马援传》)

(2) “御史司宪崔沂劾奏:‘彦卿杀人阙下,请论如法。’帝命彦卿分析。”(《资治通鉴·后梁太祖开平四年》)
(3) “于时内慢神器,外侮戎狄。君子横流,庶萌分析。”(《宋书·谢灵运传》)
(4) “臣闻《诗》、《书》、《礼》、《乐》,定自孔子;发明章句,始於子夏。其后诸家分析,各有异说。”(《后汉书·徐防传》)

  1. 有人说“大数据分析更注重关联关系而并非因果关系”,请辨析这句话。
  2. 你认为“分析”的反义词是什么?为什么?
  3. 试论述可视化在大数据分析过程中可能起到的作用。
相关文章
|
SQL 分布式计算 Oracle
使用Sqoop从Oracle数据库导入数据
使用Sqoop从Oracle数据库导入数据
使用Sqoop从Oracle数据库导入数据
|
10月前
|
数据采集 人工智能 算法
数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程
数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程
292 1
|
5月前
|
边缘计算 自然语言处理 算法
实时交互数字人端到端延迟压至0.8秒:关键技术节点与商业价值解析
0.8秒是实时数字人体验的关键阈值,端到端延迟低于此值可实现自然流畅交互。本文解析其技术链路、核心支撑与商业价值,揭示为何这一指标成为数字人从“可用”到“好用”的分水岭。
|
7月前
|
监控 前端开发 搜索推荐
新手如何创建网站,网站建设6个阶段
本文系统解析网站建设流程,涵盖战略规划、技术选型、设计开发三大阶段,为不同用户提供实用指南。
585 24
|
数据采集 机器学习/深度学习 人工智能
《AI 剧本生成与动画创作解决方案评测报告》
《AI 剧本生成与动画创作解决方案评测报告》
452 8
《AI 剧本生成与动画创作解决方案评测报告》
|
10月前
|
Oracle Java 关系型数据库
说一说 BigDecimal 的五个坑
我是小假 期待与你的下一次相遇 ~
250 1
|
数据采集 机器学习/深度学习 算法
Python实现LightGBM回归模型(LGBMRegressor算法)项目实战
Python实现LightGBM回归模型(LGBMRegressor算法)项目实战
|
存储 算法 C语言
用C语言开发游戏的实践过程,包括选择游戏类型、设计游戏框架、实现图形界面、游戏逻辑、调整游戏难度、添加音效音乐、性能优化、测试调试等内容
本文探讨了用C语言开发游戏的实践过程,包括选择游戏类型、设计游戏框架、实现图形界面、游戏逻辑、调整游戏难度、添加音效音乐、性能优化、测试调试等内容,旨在为开发者提供全面的指导和灵感。
743 2
|
网络协议 安全 数据中心
【专栏】OSPF路由汇总技术,用于减少路由表大小和提高协议可伸缩性
【4月更文挑战第28天】本文探讨了OSPF路由汇总技术,用于减少路由表大小和提高协议可伸缩性。汇总将连续网络合并为超网,以降低网络复杂性、提升路由器性能和稳定性。文章分为概念与优势、实施方法和最佳实践三部分,强调了路由表减小、网络流量降低和管理简化等优点。实施涉及选择汇总边界、配置路由及验证调整。最佳实践包括考虑网络扩展、保持拓扑连续性和优化性能安全。OSPF路由汇总是网络高效管理的关键。
570 0
|
数据采集 数据可视化 数据挖掘
如何进行有效的数据清洗?
如何进行有效的数据清洗?
1400 3

热门文章

最新文章