PLUS是队伍名字,不是哪个基准帖子的升级版哦。
去年发现有娃了之后,就给娃起了个小名叫加号,之后苹果发布了 6+,结果PLUS就烂大街了。
------------------------------------------------------------------------------我是方案简介分割线----------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
我的主要方法之前在zju和bupt分享的时候也已经提到了,详细的就不再说了,之后简单介绍下,并说明下初赛到决赛的方案的升级点。
方案简介:
1. ARIMA + LM
预测整月的数据
2.
对一些特征点进行调优 (
中秋,调休,国庆前)
决赛相对之前的升级:
模型方面主要是增加了数据预处理 和 线性模型中的特征;
特殊时间点方面,主要是更好的刻画了月初、月末的特征
----------------------------------------------------------------------------我是 一点心得 分割线----------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
人力资源篇:
1. 人多力量大:一个人组队还是比较累的,而且会局限于自己的思路,通过改变方法模型来提升的概率较低。
2. 主要分工:一个人来做数据、特征和尝试非最优方法;一个人来优化最优方法;一个人来调特殊时间点;一个人组队都没怎么尝试其他方法
3. 如果团队的人力资源充足的话,最好有人手能够细致的对历史数据有足够的了解,就是在初期能够对模型得到的结果有一个优劣的判断;
后期主要是微调了,变化太细微,人工check意义不大;
评测篇:
1. 如果评测机会比较充足,同时有些迷茫后续的优化方向在哪里;花费一天的代价,了解一下自己的purchase得分和redeem得分对后续方向的指导意义比较大。
一般来说,purchase由于比较稳定,所以得分应该更高;而redeem会因为波动比较大,预测难一些
2. 发生了许多线下拟合8月份得分提高,实际效果下降的情况;这时一定不要迷信用八月份的数据做线下评测得到的效果,需要另辟蹊径找到评价指标;
八月份数据略坑,及早从坑里爬出来
3. 一般而言,最后的评估函数不是线性的,越准确上分速度越快,加入一些小幅的噪声有可能能够提高成绩;
运气不太差的话,如果有相同数量的点靠近和远离正确答案,那么会有一些分数提高;这条适合最后一天拼命用。
数据处理篇:
1. 进入御膳房的时候,大家手头应该已经有两份本地的数据了;算上御膳房中的数据,综合三份数据,能够比较好的判别一些特征是否是过拟合
2. 对于大额交易的处理是一个有效的提高得分的预处理方案,主要基于的思想是,
申购的时候,即使是淘宝卖家的申购,每天的值也是不那么大额的,异常点较少;
而赎回的时候,淘宝卖家的赎回基本都是大额的,异常点就多。
------------------------------------------------------------------------------我是 平台使用小记 分割线--------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
平台使用小记 (有些图我直接截在word中了,可以下载附件查看)
内部赛主要的功能毕竟是帮助大家趟雷,是不是还在觉得为毛还要限制平台,为毛还只能用R
语言,take it easy
,哥们也是R
渣;
-------------------------
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。