关于数据的几个疑问
Re关于数据的几个疑问
我感觉楼主可能理解错了,当然,这是我感觉的,所以我说说我看了数据的感觉
其一,这次的数据应该是基于歌手来截选的数据,至于用户是谁,似乎没有太大的影响,哦,不对,应该说用户的行为也是一个特征吧。额,跑题了,数据是五十名歌手所有音乐的数据,其中的行为是“所有”用户的下载,收藏和播放,对,这里的所有很重要!
整个比赛的意义是从所有用户对选定歌手所有曲目行为中预测出这些选定歌手接下来60天的所有播放量,所以规模这个词大概应该是这样说,歌手规模是50,用户规模是所有。
额,歌手数量我还没有去检验,但是之前看另一个帖子里面是提到的,所有的歌手是有50个,通过SQL select一下应该就能验证的,这个很简单。
赞0
踩0