开发者社区> 问答> 正文

关于初始播放量的一个问题

1. 歌曲的“初始播放数”和“6个月时间内用户的播放次数累计”为何有着巨大差距?最后预测的值是是基于哪个?
2. 记录收集日(分区)是什么意思?分区是怎么分的区?
3. 要预测的艺人当天的播放数据是基于user表中已有用户的播放,还是预测网站中所有用户的播放?

展开
收起
rainvision 2016-03-14 09:00:54 7045 0
6 条回答
写回答
取消 提交回答
  • 回 8楼(白水潭生) 的帖子
    1 行为时间确实更准确一些
    2 只预测播放量。下载和收藏不算的。
    2016-03-23 19:53:25
    赞同 展开评论 打赏
  • Re关于初始播放量的一个问题
    你好:
    mars_tianchi_user_actions中的“用户播放时间”可以指“播放、下载、收藏”三个动作中的任何一个被作出的时间是吧?如果是这样我觉得改成“动作发出时间”更合适一些 ^_^
    另外,结果集中的播放数仅仅包含播放行为是么?如果用户下载或者收藏了使不能算到播放数的是吧?
    谢谢解答

    -------------------------

    Re回 7楼寒立的帖子
    不好意思,第一次使用,“回复”没有使用正确,是想请您解答的。

    -------------------------

    回 10楼junkang的帖子
    谢谢解答。还有一个问题,‘mars_tianchi_songs’的最后一个属性是‘gender’而不是‘genre’么?
    2016-03-23 17:24:41
    赞同 展开评论 打赏
  • 回 1楼宁晶的帖子
    你好,预测网站中所有用户的播放,意味着这里的用户数是抽样出来的吧?有没有关于抽样规则的说明呢?
    2016-03-21 14:21:30
    赞同 展开评论 打赏
  • 回 2楼(jiming_ye) 的帖子
    1.user_actions表所有用户相关歌曲的行为表。
    2.是的

    -------------------------

    回 4楼(giant-z) 的帖子
    1.初赛中是针对用户做了一次随机抽样,后续的真实结果也做了处理。所以原则上,你们只需要根据已有的用户规模做合理预测即可。

    -------------------------

    回 6楼(jiming_ye) 的帖子
    是指比赛提供的数据前,即3月1日前的历史播放量,供大家参考。

    -------------------------

    回 11楼(白水潭生) 的帖子
    gender是歌手性别性别相关包含男,女,乐队。不是风格流派信息。详情可参考文档说明。
    2016-03-21 10:56:12
    赞同 展开评论 打赏
  • 回 1楼宁晶的帖子
    你好,那请问user_actions表中包含了songs表中所有歌手相关的操作数据吗

    比如说把user_actions中某一歌手所有歌曲的播放量加一起,是不是该歌手6个月内的总播放量

    -------------------------

    回 3楼寒立的帖子
    谢谢啊,还有一个问题,“初始播放量”到底是指什么呢
    2016-03-20 01:15:46
    赞同 展开评论 打赏
  • 回 楼主(rainvision) 的帖子
    1. 有些歌曲如果比较早,和6个月时间内的播放次数差距很大也是有可能的。最后预测的是预测接下来60天每天的播放量。
    2. 第一张表是一张分区表,按照日期来分区。在sql语句的where条件里加分区字段“ds="xxx"”可以避免全表扫描,节省机器资源。
    3. 预测网站中所有用户的播放。
    2016-03-14 10:42:35
    赞同 展开评论 打赏
滑动查看更多
问答地址:
问答排行榜
最热
最新

相关电子书

更多
用计算和数据去改变整个世界 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载