R 基本数据管理--数据集合并、子集的提取以及随机抽样函数| 学习笔记

简介: 快速学习 R 基本数据管理--数据集合并、子集的提取以及随机抽样函数

开发者学堂课程【大数据之 R 语言速成与实战R 基本数据管理--数据集合并、子集的提取以及随机抽样函数】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/363/detail/4335


R 基本数据管理--数据集合并、子集的提取以及随机抽样函数

 

内容简介:

一、数据集合并

二、数据取子集

三、随机抽样函数

 

一、数据集合并

>x<- matrix(c(1,2,3,4,5,6,7,8,9),nrow=3,ncol=3)

>x

> y<-x

> y

> z <- cbind(x,y)

> z

>?merge

>x <- data.frame(k1 = cNANA,345,k2 =c(1,NA,NA,4,5),

data = 1:5

>x

> y

> z <-merge(x,yby=k1)

> z

> y<-x

>X

[,1]  [,2]  [,3]

[1,]  1    4   7

[2,]  2    5   8

[3,]  3    6   9

> y

[,1]  [,2]  [,3]

[1,]  1    4   7

[2,]  2    5   8

[3,]  3    6   9

> z <-rbind(x,y)

> z

[,1]  [,2]  [,3]

[1,]  1    4   7

[2,]  2    5   8

[3,]  3    6   9

[,4]  1    4   7

[,5]  2    5   8

[,6]  3    6   9

>X[,2:3]

[,1]  [,2]  

[1,]  4    7

[2,]  5    8

[3,]  6    9

 

>manager <-c(1,2,3,4,5)

>date<-c("10/24/08",'10/28/08","10/1/08","10/12/08","5/1/09")

>country <-c("US","US","UK","UK","UK")

>gender <- c("M","F","F","M","F")

>age <- c(32,45,25,39,99)

>q1<-c(5,3.3.3.2)

>q2<-c(4.5.5.,3.2)

>q3<-c5,2,5,4,1

>q4<-c(5,5,5,NA,2)

>q5<-c(5,5,2,NA,1)

>survey<-data.frame(manager,date,country,gender,age,q1,q2,q3,q4, q5,stringsAsFactors=FALSE)

>

>survey

 

二、数据取子集

>survey

>q<- survey[,6:10]

>q

>x<- survey[,-2]

>x

 

三、随机抽样函数

>survey

> mysample<- survey[sample(5,3,replace=FALSE),]

> mysample

>newdata <- subset(survey,age>=35age<24,

select=c(ql,q2,q3,q4))

> newdata

> mysample<- survey[sample(5,3,replace=FALSE),]

> mysample

> mysample<- survey[sample(5,3,replace=FALSE),]

> mysample

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
相关文章
|
3月前
|
数据采集 存储 安全
数据治理≠数据管理!90%的企业都搞错了重点!
在数字化转型中,数据不一致、质量差、安全隐患等问题困扰企业。许多组织跳过基础的数据管理,直接进行数据治理,导致方案难以落地。数据管理涵盖数据生命周期中的采集、存储、处理等关键环节,决定了数据是否可用、可靠。本文详解数据管理的四大核心模块——数据质量、元数据、主数据与数据安全,并提供构建数据管理体系的四个阶段:评估现状、确定优先级、建立基础能力与持续改进,助力企业夯实数据基础,推动治理落地。
|
7月前
|
存储 数据管理 数据格式
数据治理 vs. 数据管理:别再傻傻分不清!
数据治理 vs. 数据管理:别再傻傻分不清!
394 10
|
3月前
|
数据采集 存储 SQL
数据管理四部曲:元数据管理、数据整合、数据治理、数据质量管控
老张带你搞定企业数据管理难题!数据找不到、看不懂、用不好?关键在于打好元数据管理、数据整合、数据治理和数据质量管控四大基础。四部曲环环相扣,助你打通数据孤岛,提升数据价值,实现精准决策与业务增长。
数据管理四部曲:元数据管理、数据整合、数据治理、数据质量管控
|
5月前
|
数据采集 人工智能 监控
企业数据来源杂、质量差,如何通过主数据管理解决?如何确保数据可信、一致和可用?
本文三桥君系统介绍了主数据管理(MDM)在企业数字化转型中的关键作用。产品专家三桥君从数据清洗、治理、处理到流转四个维度,详细阐述了如何通过标准化流程将数据转化为企业核心资产。重点包括:数据清洗的方法与工具应用;数据治理的组织保障与制度设计;数据处理的三大核心动作;以及数据流转的三种模式与安全控制。专家三桥君强调主数据管理能够推动企业从"经验决策"转向"数据驱动",并提出构建统一数据服务网关、"数据血缘图谱"等实战建议,为企业数字化转型提供系统化解决方案。
232 0
|
人工智能 关系型数据库 分布式数据库
拥抱Data+AI|“全球第一”雅迪如何实现智能营销?DMS+PolarDB注入数据新活力
针对雅迪“云销通App”的需求与痛点,本文将介绍阿里云瑶池数据库DMS+PolarDB for AI提供的一站式Data+AI解决方案,助力销售人员高效用数,全面提升销售管理效率。
|
物联网 数据管理 Apache
拥抱IoT浪潮,Apache IoTDB如何成为你的智能数据守护者?解锁物联网新纪元的数据管理秘籍!
【8月更文挑战第22天】随着物联网技术的发展,数据量激增对数据库提出新挑战。Apache IoTDB凭借其面向时间序列数据的设计,在IoT领域脱颖而出。相较于传统数据库,IoTDB采用树形数据模型高效管理实时数据,具备轻量级结构与高并发能力,并集成Hadoop/Spark支持复杂分析。在智能城市等场景下,IoTDB能处理如交通流量等数据,为决策提供支持。IoTDB还提供InfluxDB协议适配器简化迁移过程,并支持细致的权限管理确保数据安全。综上所述,IoTDB在IoT数据管理中展现出巨大潜力与竞争力。
483 1
|
SQL NoSQL 数据管理
数据管理DMS使用问题之如何批量导入MongoDB的数据文件
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
|
SQL 运维 数据管理
数据管理DMS产品使用合集之如何使用REPLACE函数
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
163 2
|
关系型数据库 分布式数据库 数据库
云栖大会|从数据到决策:AI时代数据库如何实现高效数据管理?
在2024云栖大会「海量数据的高效存储与管理」专场,阿里云瑶池讲师团携手AMD、FunPlus、太美医疗科技、中石化、平安科技以及小赢科技、迅雷集团的资深技术专家深入分享了阿里云在OLTP方向的最新技术进展和行业最佳实践。

热门文章

最新文章