开发者社区> 问答> 正文

什么是分类数据和顺序数据?

什么是分类数据和顺序数据?

展开
收起
鲁花花生油 2021-11-03 15:04:15 12475 0
来自:华章出版社
1 条回答
写回答
取消 提交回答
  • 在数据建模过程中,很多算法无法直接处理非数值型的变量。例如,KMeans算法基于距离的相似度计算,而字符串则无法直接计算距离。另外,即使算法本身支持,很多算法实现包也无法直接基于字符串做矩阵运算,例如Numpy以及基于Numpy的sklearn。虽然这些库允许直接使用和存储字符串型变量,但却无法发挥矩阵计算的优势。这些类型的数据变量可以分为两类。

    1)分类数据:分类数据指某些数据属性只能归于某一类别的非数值型数据,例如性别中的男、女就是分类数据。分类数据中的值没有明显的高、低、大、小等包含等级、顺序、排序、好坏等逻辑的划分,只是用来区分两个或多个具有相同或相当价值的属性。例如:性别中的男和女,颜色中的红、黄和蓝,它们都是相同衡量维度上的不同属性分类而已。

    2)顺序数据:顺序数据只能归于某一有序类别的非数值型数据,例如用户的价值度分为高、中、低,学历分为博士、硕士、学士,这些都属于顺序数据。在顺序数据中,有明显的排序规律和逻辑层次的划分。例如:高价值的用户就比低价值的用户价值高(业务定义该分类时已经赋予了这样的价值含义)。

    资料来源:《Python数据分析与数据化运营(第2版)》,文章链接:https://developer.aliyun.com/article/726313

    2021-11-03 15:16:54
    赞同 3 展开评论 打赏
问答地址:
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
用计算和数据去改变整个世界 立即下载
重新定义计算的边界 立即下载
RowKey与索引设计:技巧与案例分析 立即下载