非基向量_个人页

非基向量

文章

问答

视频

个人介绍

暂无个人介绍

擅长的技术

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

暂无更多信息

正在加载, 请稍后...

暂无更多信息

回答了问题 2014-04-22

关于昨天群内有实验室多号测试融合数据事件（标题已改）

Re关于昨天群内有实验室多号测试融合数据事件（标题已改）如果是真的，港科大队伍的融合和别的比赛如Netflix中所用到的ensemble learning有本质区别。简单说就是有没有private set的问题，Netflix和KDD Cup这么多届的比赛办下来，使用private set的一个原因就是防止这种情况发生。内部赛的时候没有这种情况发生，我觉得是各个小组分布在公司工位上，比赛是在一个封闭的空间里进行的，加上阿里的员工比较自律，都是按照玩数据第一，比赛第二的精神来的，所以一直没有出事。如果第二赛季还是没有private set的话，大家都不考虑泛化能力（@天猫_德福把这个叫做运气，但我觉得运气也有科学，而非玄学），那么多个队伍之间的串通（或者叫伪小号？）根本无解。就算安全团队出动，反作弊手段全上也没有办法。查相似度？本来总有人用近似的算法，相似也很合理。。。查log，查IP？本来就是不同团队分散提交的，怎么可能相同。。。事到如今，无非两种做法，一是期待参赛团队的自律精神（如我前面所说，我觉得这种对于反作弊的期待实在是太高了）；二是改成private set的评测机制。我比较倾向于后者，并非不相信大家，而是因为，法立于上则俗成于下。之前老师不推荐我参加这个比赛，他觉得比赛的评测漏洞太多，事到如今，我玩着玩着停不下来了，才有点明白老师的意思。愿主办方三思。

赞0 踩0 评论0
回答了问题 2014-03-22

我来发第一帖，总感觉这比赛不是真正意义的推荐算法比赛呢

Re我来发第一帖，总感觉这比赛不是真正意义的推荐算法比赛呢比赛本来就是这样，如果说很完善的算法就能得到很好的结果，那这个比赛还有什么意义呢？就只比谁套用现成的算法更熟练？看谁调参的时候人品更好？而且CF和SVD做到3%还是很容易的，结合一些其他方法可以得到不错的效果。但是不得不吐槽，第三阶段的玩法完全不一样啊，前两阶段的意义何在？虽然我这种最多撑到第二轮的是无所谓啦。。。。

赞0 踩0 评论0
回答了问题 2014-03-19

求今天演讲的PPT

Re求今天演讲的PPT +1

赞0 踩0 评论0
回答了问题 2014-03-17

大家说说都能预测出来多少用户

Re大家说说都能预测出来多少用户 lz你再好好数数。。。

赞0 踩0 评论0
回答了问题 2014-03-11

有正确的预测结果数据吗

Re有正确的预测结果数据吗可以把训练集分为两部分，用交叉验证的方法，不过我觉得一周一次，总共也就五六次的测试机会有点少了，第一轮只能求人品了~

赞0 踩0 评论0

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

非基向量_个人页

个人介绍

擅长的技术

关于昨天群内有实验室多号测试融合数据事件（标题已改）

我来发第一帖，总感觉这比赛不是真正意义的推荐算法比赛呢

求今天演讲的PPT

大家说说都能预测出来多少用户

有正确的预测结果数据吗