近期,CCTV9播放了自制的系列纪录片《大数据时代》,该片是国内首部大数据产业题材纪录片,节目细致而生动地讲述了大数据技术在政府治理、民生服务、数据安全、工业转型、未来生活等方面给我们带来的改变和影响。在第四集中,讲述了芝麻信用如何助力共享经济,推动商业信用体系建设的故事。我们将其摘录分享出来,并简要介绍芝麻信用背后的技术。
曹雪莹是一名平面模特,工作性质让她经常穿着不同的服装,在不同的场合,需要穿不同的衣服,并且风格还不能重样,服装开销占了曹雪莹日常开支的很大一部分。很多女人,总会感觉自己的衣橱里少一件衣服,曹雪莹更是如此。
一个偶然的机会,曹雪莹发现了一种共享衣橱的消费模式,每月花销不到500元,便可换穿30件衣服,其中有不少,是高于曹雪莹消费水平的轻奢品牌,并且大部分衣服都是免押金。一年下来,曹雪莹可以节省很多买衣服的钱,这一切得益于信用体系。
芝麻信用技术总监毛仁歆,便是这个信用评价体系的搭建者之一。他一直在用算法和模型创新商业模式,信用评估,便是毛仁歆团队利用算法创造的一个非金融的商业信用评价体系。
“我们其实在技术领域有非常非常多的创新,通过这样的一个信用评价体系,我们将用户各个维度的数据计算,最终输出一个用户的守约画像。”毛仁歆说道。
商业信用评价体系,从一个人的身份特征、信用历史、履约能力等方面进行综合评分,通过机器学习、时序建模、深度学习、网络分析等技术,精确评估出用户在不同商业场景的守约行为,信用评估作为共享经济中买卖双方建立信任的纽带,它的评分规则必须保证客观和公平,这促使毛仁歆和他的团队,要不断提高守约行为预估的精准度,这样可以让商家扩大自身业务的同时,有效控制经营风险。
随着信用平台体系的不断完善,越来越多的网民加入到中国人自创的购物狂欢节中,一个新的产业链也随之诞生。这里便是新经济体系下的另一个环节,工作人员正在把回收的衣服运到清洗车间,衣服经过分拣,被放进大型洗衣机中清洗,然后经过高温熨烫,臭氧消毒,塑封包装等环节,进入巨大的服装仓库。
当共享衣橱系统,接收到消费者的订单后,工作人员会从服装仓库的几十万件衣服中拣选出对应的款式,然后衣服在流水线上被电脑系统细化分拣,打包后快递发出。
借助于这个信用评估体系,共享衣橱这种共享经济消费模式越来越受年轻人青睐,随着共享经济模式的普及,更多用户有机会展示自己的守约行为,积累自身信用,信用评价体系也得到持续优化,进而刺激了中国消费市场的活力。
信用评估中涉及的机器学习方法由浅到深均有涉及,其从线性、时序和结构数据上进行统一建模的框架即芝麻分背后的DeepCredit技术。传统评分卡技术,虽然能给每一个用户提供一个可解释的芝麻分组成,但模型的评估准确度非常依赖底层的特征工程。近几年来深度学习技术极大的推动了时序挖掘、图网络分析、自然语言处理、图像识别等领域的发展,也为更准确的用户信用画像评估提供了可能。
通过对时序挖掘方法的研究,芝麻信用对深度学习在信用评估中的应用做了探索,其通过对用户的守约历史进行时序建模,完整刻画了一个用户在时间维度上的守约表现。传统在金融领域的守约历史数据挖掘主要依赖开发人员的业务经验,受到工作量大、特征维度少等影响,最终无法达到商业应用的性能要求。在建模过程中,深度学习中的循环神经网络(RNN)及其变种时序算法能较好的对序列数据建模,当前在语音识别、机器翻译、序列预测上都有非常棒的应用。芝麻分团队首次将多层循环神经网络应用在数亿用户规模的守约时序行为上,模型示意图如下图所示。通过在模型结构中引入了Stacking、Embedding、Wide&Deep等优化技术,通过算法学习到了用户的守约习惯,如按时守约、多用多守约等。最终的性能效果相比传统方法有显著提升40%+,给商业场景带来更多的准入用户、更低的资金成本。
当前芝麻信用已经深入渗透到支付宝的各个产品当中,同时对外开放向合作伙伴提供服务。芝麻信用也将投入更多精力优化技术,推动商业信用体系的加速到来。