jxu_个人页

个人头像照片 jxu
0
63
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息
正在加载, 请稍后...
暂无更多信息
  • 回答了问题 2014-05-05

    关于MapReduce,sql官方内部使用方法的问题

    回 楼主(ly) 的帖子 绝大部分的数据处理都可以通过SQL来实现(MR就更加灵活了)。 具体什么场景下的数据操作是ODPS SQL实现不了的,可以发到论坛里。
    踩0 评论0
  • 回答了问题 2014-05-01

    大家等着跑程序的时候都干啥。。

    跑任务的时候写下一个任务的代码呀。
    踩0 评论0
  • 回答了问题 2014-05-01

    请问sql可以支持减法操作吗?

    ODPS的SQL和Hive类似,和ANSI SQL有区别,可以参考下Programming Hive这本书Join相关的章节。 如果实现把B表中包含在A表中的记录排除掉,也就是A - B,可以使用left outer join,将(join key) is null的记录挑出来。
    踩0 评论0
  • 回答了问题 2014-05-01

    关于hive和mahout

    回 楼主(imma) 的帖子 Xlib现在支持的功能和算法比内部赛的时候都有了增加和改进,利用已有的工具是能做出好成绩的。现在排行榜TOP同学的成绩提升空间很大。 Hive的功能ODPS基本上都是支持的,自定义Mapper的Reducer可以通过UDF和UDAF来实现,建议参考下文档。
    踩0 评论0
  • 回答了问题 2014-05-01

    mapreduce、odps与xlab之间的关系,以及如何使用python语言读取ali数据

    回 4楼(小斯never) 的帖子 ODPS不支持类似Hadoop的Streaming形式的Job,所以楼主想要的比较难实现,可以通过Python写的UDF和UDAF实现部分。
    踩0 评论0
  • 回答了问题 2014-04-25

    关于season2使用的语言

    回 楼主(ki_zero) 的帖子 SQL里的UDF函数可以用Python开发。
    踩0 评论0
  • 回答了问题 2014-04-25

    文档不好懂啊,MR或UDF如何获取ODPS里的表数据?

    训练和数据集的切分用SQL也是容易实现的,算法的部分可以用Eclipse先在local做开发和测试,或者用Xlib里集成的工具来做。
    踩0 评论0
  • 回答了问题 2014-04-25

    虚拟机里求软件专帖

    回 2楼(caiminxing) 的帖子 用Python跑SQL的目的是?
    踩0 评论0
  • 回答了问题 2014-04-25

    S2为什么连这么主流的语言C都不支持呢?

    ODSP目前支持的语言和编程框架请看文档。
    踩0 评论0
  • 回答了问题 2014-04-18

    官方的反作弊系统来把这个测一下

    最近一次提交时间基本都是4月18日,给系统一点时间:)
    踩0 评论0
  • 回答了问题 2014-04-18

    非官方指南第一季终结篇

    回 6楼(oilbeater) 的帖子 oilbeater同学的几篇教程非常棒,相信也给其他很多同学带来帮助,点赞。 不知道你说的“客服或者懂技术的客服”是不是像得福、亚娟这样一直在论坛里给大家回帖的同事,我们不是客服呀亲……我们是在内部赛里爬过各种坑的、和大家一样的经历过比赛的人,希望能在比赛里给大家一些帮助和建议,让大家取得更好的成绩。平时也有很多工作要做(好多帖都是夜里回复的),作为攻城师可能比较直接。你的意见收到,Season 2会继续在论坛里给大家答疑的(相对于S1,S2真心不容易)。
    踩0 评论0
  • 回答了问题 2014-04-16

    为什么最近老是上传不了result

    目测是半角和全角字符的问题。
    踩0 评论0
  • 回答了问题 2014-04-15

    【请问】【这次的数据集涉及天猫超市吗?】

    不含天猫超市的数据。
    踩0 评论0
  • 回答了问题 2014-04-15

    第二阶段的数据抽样方式和第一阶段的数据抽样方式一样吗?

    S1的数据是S2一个抽样过的子集。 S1中训练数据和测试数据是用相同抽样方式获取的,之前的帖子里也提到过,9月的成交变化是天猫成交的自然增长,用户购买本身是存在淡季和旺季的。
    踩0 评论0
  • 回答了问题 2014-04-14

    大家猜猜,最后进入S2的top500会不会就是S2的top50呢。。。

    请不要做没有根据的揣测。
    踩0 评论0
  • 回答了问题 2014-04-11

    关于提交答案的问题,同userid提交了两不同的答案

    请按照正确的格式提交数据。
    踩0 评论0
  • 回答了问题 2014-04-11

    删除ing

    回 楼主(好了,是我) 的帖子 别的组成绩在提高,不前进就是后退。还有10天时间,提升空间应该不小的,加油吧,有问题可以在论坛里提问。
    踩0 评论0
  • 回答了问题 2014-04-11

    调查:第二赛季希望有哪些机器学习的算法包

    回 10楼(lubor) 的帖子 R是支持的。Matlab不会支持。
    踩0 评论0
  • 回答了问题 2014-04-11

    有没有坚持用协同过滤的~

    如果成绩一直提高不上去为什么还要坚持,而不是考虑其他方法和思路呢?不要早早把思路局限死。 ------------------------- 为什么要用LR或者分类方法,针对的是哪一类的用户,天花板在哪里?如果要突破怎么走?为什么要用协同过滤方法,针对的是哪一类用户的行为,天花板在哪里,怎么调整?单一模型怎么提升和调整,多模型如何融合和配合。
    踩0 评论0
  • 回答了问题 2014-04-09

    【一个关于每日结果更新的小建议】

    内部赛的评分时间是凌晨四点,好多次我们都是卡着点儿提交的。 比赛是持久战,要劳逸结合。 ------------------------- 回 4楼(龙泉僧伽) 的帖子 2点是评分时间,提交完结果该睡觉就睡觉呗。 早点处理完早点提交,第二天看排名不是更合理吗,为什么一定要熬夜?
    踩0 评论0
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息