阿里在大数据分析后的可视化这块有什么好的解决方案,比如对超过1亿数据进行聚类操作后,对聚类结果如何进行可视化的显示和分析?如果对大数据量的可视化分析实现上比较困难,是否有其他可以替代的方案?
一般聚类算法后 每个类和类之间都会有一个 相似度 然后这个相似度矩阵是一个图 可以用来做 node-link graph, layout 用 force-direct 算法。类的大小表示类中数据的数目。类的颜色表示它们的属性等。node之间的 link 选 top k ,颜色用相似度标注,粗细也可以表示相似度。这种方式可以做启发式探索。
没有可视化只有一个数据list 无法表达这种启发式信息,人只能接受聚类后的结果。而可视化的启发性在于,但不唯一,人可以通过可视化中node大小和远近发觉可能被merge的类和应该分的很开的类。这都是因为 聚类算法的结果并不唯一。参数变了 结果就变了。但有值得相信的地方。也会可能不对的地方。但人眼可以发现这种信息。因为人对聚类的概念很灵活。
同时,阿里DT可视化团队也研发了一些聚类和关系图分布算法并应用到了阿里图计算架构之中,帮助用户更直观地了解图计算过程。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。