这个时候,玄酱是不是应该说点什么...
暑假和小伙伴们约好一起读Pattern Recognition and Machine Learning(模式识别与机器学习,下简称PRML)。初步打算每周读一章,大家轮流主讲。开了专栏以后一直没写过东西,第一部分内容就准备贡献给PRML了。
本文接模式识别与机器学习第一讲(上)。关键词:随机变量、条件概率、边际概率、sum rule、product rule、贝叶斯公式、先验概率、后验概率、独立、概率质量函数、概率密度函数、累计分布函数、多元分布、换元、期望、条件期望、方差、协方差。
关于深度学习的框架之争一直都没停止过,每隔一阵大家就要进行一次框架大讨论:
在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmeans函数就要你提供聚类数目这个参数,总不能两眼一抹黑乱填一个吧。之前也被这个问题困扰过,看了很多博客,大多泛泛带过。今天把看到的这么多方法进行汇总以及代码实现并尽量弄清每个方法的原理。
咱们不提 CES 2017 上激动人心的自动驾驶产品(估计七八年之后你的驾驶证就可以扔掉了),也不细讲《最强大脑》节目里人类精英在图像识别环节被碾压(这曾经是人类可以嘲笑人工智能的典型领域),就说说围棋界的海啸吧。
不知道你有没有这样的感受,在刚刚入门机器学习的时候,我们一般都是从MNIST、CIFAR-10这一类知名公开数据集开始快速上手,复现别人的结果,但总觉得过于简单,给人的感觉太不真实。
他提到,在Facebook,ONNX是他们的人工智能团队中有关深度学习方法的重要组成部分,他们一直致力于推动人工智能的前沿发展,开发出更好的学习算法。一旦发现新的突破
yTorch是TensorFlow之外一个非常好的选择,虽然 PyTorch仍在测试阶段,我希望在可用性、文件和性能方面它能有更多的改变和进步。PyTorch非常Python化,用起来很容易。
NCCL在不同的深度学习框架(CNTK/Tensorflow/Torch/Theano/Caffe)中,由于不同的模型大小,计算的batch size大小,会有不同的表现。比如上图中CNTK中Resnet50能达到32卡线性加速比
近日,Kaggle Blog上刊登了对「Planet: Understanding the Amazon from Space」比赛冠军的专访,在访问中,我们了解到了冠军选手bestfitting的一些基础信息,他在比赛中所用的一些技术细节,以及给大家的建议。
强化学习(Reinforcement Learning,RL)由于其前卫的学习方式,本不如监督学习那么方便被全自动化地实现,并且在很多现实应用中学习周期太长,一直没有成为万众瞩目的焦点,直到围棋狗的出现,才吸引了众多人的眼球。
值得感慨的一方面是今天技术的发展非常快,故步自封自然是万万万万不可取,深知还有很多理论尚且不懂还要继续深读paper;另一方面,理解理论原理和做好项目间实际非常有巨大的gap,特别是身处工业界的同仁们,学术圈值得钻但要把握分寸,如果仅仅追逐技术深度,不免容易陷入空中阁楼。
在深度学习进行分布式训练时,常常采用同步数据并行的方式,也就是采用大的batch size进行训练,但large batch一般较于小的baseline的batch size性能更差,请问如何理解调试learning rate能使large batch达到small batch同样的收敛精度和速度?
作者们在测试中发现,组合训练对AI训练非常重要。他们的做法是,在训练AI模型的时候,先让内置AI玩一定的时间,然后交给要训练的AI接着玩。这就降低了游戏初始时的难度,而且给游戏带来了更多的变化,避免掉进局部最小值里。
众所周知,一个人在约会平台上发布的照片通常经过精挑细选,往往会化妆打扮以及对照片进行 PS。这些照片和一个人真实的生活状态应该是有区别的。因而,若把该算法应用于普通生活照片,其准确性极有可能会大幅降低。
欧洲科学院近日公布2017年院士增选结果,南京大学计算机系周志华教授当选欧洲科学院外籍院士。
上述图表只汇报了小部分结果,更多结果详见我们论文。从上述结果中,我们发现,基于 Directly Estimator 在所有 setting 下都失败了,这是因为该方法忽略了数据中存在的 confounding bias;基于 propensity score 的方法
二十国集团(G20)智慧创新论坛暨2017全球创新者大会(下称创新者大会)在深圳市洲际酒店召开。该大会是2016年杭州二十国集团工商峰会(B20峰会)提出的“G20智慧(SMART)创新倡议”的后续活动
UCLA电气工程与生物工程学院校长兼加州纳米系统研究所副所长Aydogan Ozcan称:“让更多人掌握这种具备实验室质量的空气检测设备,可以收集和分析来自更多地点的高质量数据,这样会有助于帮助政府制定更好的政策和法规来改善空气质量。“
在9月9日自然语言处理领域顶级会议 EMNLP 2017的开幕式上,大会主席Martha Palmer向我们展示了一系列关于EMNLP 2017的论文录取情况。
9月11日下午,阿里云方面确认了世界知名量子计算科学家、密歇根大学终身教授施尧耘入职的消息。施尧耘将担任阿里云首席量子技术科学家,成为阿里巴巴集团量子信息技术的学科带头人。
国科学院大学为核心、研究所深度参与,建设国家级的智能科技教育平台,努力形成科研、教育、创业、产业深度融合,创新型人才培养与技术应用型人才培养互补,专业化培育与定制型培育结合的教育体系。
近日,自然语言处理领域顶级国际会议 EMNLP 于丹麦哥本哈根举行。EMNLP是自然语言处理三大顶级会议(ACL, EMNLP, NAACL)之一,已经于前段时间公布了录用论文及最佳论文名单。
本文围绕着近年来深度学习在语音合成和语音增强问题中的新方法展开介绍,虽然语音合成和语音增强需要解决的问题不同,但是在建模方法上有很多相通之处,可以相互借鉴。深度学习方法在语音转换、
NIPS 2017将于今年12月在美国长滩举办。自 1987 年到 2000 年,NIPS都在美国丹佛举办,虽然后来也曾经在加拿大温哥华、西班牙的格兰纳达、加拿大蒙特利尔举办,但不得不承认的是,美国一直是全球科研的主要阵地。
AI圈推特红人,Keras框架的作者François Chollet又搞大新闻了!近日François Chollet在推特上发推称:“深度学习研究已经进入了瓶颈期。将深度学习应用于解决现实生活问题的应用正在迎来一个大爆发。”
各家金融机构已经开始付诸行动,把机器学习、人工智能运用到各个领域。高盛是银行业变革进程中的领头羊之一,他们利用复杂的交易算法(有些算法具有机器学习能力),在货币和期货等交易领域实现大规模自动化。
南京金秋洽谈会“2017中国人工智能峰会(CAIS 2017)”在南京国际博览会议中心盛大开幕。本次峰会以“创新、变革、突破”为主题,并设两大主题论坛,共吸引了30余位人工智能领域著名的科学家、企业领袖亲临现场,1500余名专业观众报名参会,雷锋网作为受邀媒体参加了本次峰会并进行了报道。
第三种是行业市场。这里包含了教育、医疗、金融等市场,这个领域需要和行业深度结合,巨头很难做,其实是创业公司的机会。
从目前已经披露的信息看,Capsule的概念会更仿生一些,能够更好地模拟人类大脑神经元之间的复杂连接结构,但对这个框架具体的数学描述仍有待于进一步研究。
在这篇文章中,我们证明了一个扰动形式的梯度下降可以收敛到二阶驻点,其使用的时间与标准的梯度下降收敛到一阶驻点的时间几乎相同。这意味着,在有效地逃离鞍点的问题上,Hessian 信息是不必要的。
不过这只是降低预期的说辞,在他看来,虽然路由器被证明是个伪风口,但“数据中心”“网络中心”基本上被做实了,如果“小爱同学”能做实语音控制中心,他们便多一个点获取数据。
这种损失函数因为内含了类型树中不同类之间的亲疏关系,预期中应当能够增强分类学习的效果。不过经过六组实验的对比,作者发现结果并没有显著的改进。作者认为,不管怎么着吧,至少这表明层级损失函数能用。
联合训练可以分别帮助两个模型得到更好的效果,有趣的是生成式模型最终效果比判别式的好。同时我们也做了一些实验的分析,发现联合训练后两个模型确实可以相互取长补短,学到对方一些好的特性。
据彭博社报道,通用电气公司正在研究一种在电网上应用人工智能(的方法。该公司预计,这项技术将大大提高电网的效率,如果在全球范围内得到应用能节省2000亿美元的资金。
根据协议,滴滴出行和香港科技大学将在智慧交通系统前沿技术、创新技术等领域展开研究,包括但不限于机器学习、智慧交通、数据挖掘、运筹学、自然语言处理、计算机视觉、机器人等方向。
但在未来,人工智能游戏选手或许将会面临新的对手:另一个人工智能。今天,全球最大的3D游戏引擎Unity宣布发布Unity Machine Learning Agents,通过将其游戏引擎与TensorFlow等机器学习框架相连接
所以她也为报名的学员提了一些建议,比如可以去看一看目前感知、交互方面的文章、综述等,做一个基本了解。如果对于某一方面特别感兴趣,建议查查相关讲者的简历和介绍,准备好问题跟他们进行交流。
并且已经成功应用到包括计算机视觉和药物研发在内的具有高维数据的领域。今年5月,OpenAI也发布了类似的在虚拟场景下通过一次性学习,完成堆叠方块等任务的论文。
“游戏开发”是一项非常复杂的任务,并且需要耗费大量的人力资源。图形艺术家、故事叙述者和软件工程师需要共同努力,才能打造出比较好的游戏环境、游戏情节和人物角色行为。
自然语言处理(NLP)一直是人工智能领域的重要话题,而人类语言的复杂性也给NLP布下了重重困难等待解决。随着深度学习(Deep Learning)的热潮来临,有许多新方法来到了NLP领域,给相关任务带来了更多优秀成果,也给大家带来了更多应用和想象的空间。
滴滴出行与香港科技大学达成战略合作,滴滴出行 CTO 张博出席了签约仪式,并受邀与数百名港科大师生面对面互动交流。张博在演讲中不仅分享了滴滴在智慧交通领域的实践经验
如今的静脉识别兼具四大特点:高度防伪、简便易用、快速识别及高度准确。最为重要的一点是,指静脉识别的特征已被国际公认具有唯一性,且和视网膜相当
联合国内外2000多家石油与化工巨头企业共同组建的“中国石油和化工行业人工智能联盟”在本次大会上宣布正式成立,并同时成立联盟工作领导小组,现场公布了领导小组成员名单
在图像处理器中,这些程序基本上具备相同大小的存储单元,而在下一步工作中,研究人员正在考虑将文件格式的方法概括为一种,使得程序可以更灵活的组织数据和使用除数组之外的数据结构(如树或链表等)。
黄意尧撰写了关于这篇论文的研究历程,以供学习与参考。雷锋网 AI 科技评论做了不改动原意的编辑与修改,将繁体字转换为简体,并将一些台湾常用表述转换为大陆的通用说法。
关系网络机器适合于学习关系。该方法可以高效地使用数据。同时该方法也足够灵活,可以与CNN,LSTM一起作为一个混合解决方案。
刚买两块Titan Z GPU准备搞搞深度学习,结果原来的工作站功率不够,带不动,所以准备组装一台新工作站。求大神们给点意见,最好给个完整的list,我好照着买
研究院成立后,将面向全球新一轮科技革命,聚焦国际前沿大数据智能技术领域,分别在数据驱动的粒认知计算基础理论、脑认知与人机混合智能、智能安全、智能决策与智能工厂、智能健康、智能生态安全等方向