Kreditech,对全球40亿人进行信用风险评分

简介:

现如今向征信局施压的不仅仅是些早期的初创公司了,越来越多的大鱼们开始游弋于信用风险这片水域。比如说,全球银行技术与支持服务的供应商Kreditech Group,正在成功地运用大数据技术来给全球范围内没有被信用评分体系覆盖的40亿人打分。


“在机会型试验试错的方法下,我们的数据科学家持续地引入新的资源和信息集”,SebastianDiemer, Kreditech的创始人和CEO说到,“这使得我们的评分系统完胜传统的征信局的评定:历史数据只能覆盖非常有限的一部分人群,但我们的方法可以将全球未被评分过的40亿人全包括进来。而且我们的后验测试证明了征信局评定的预测能力非常低。


尽管现阶段Kreditech侧重于建立一个信用良好的次优借款人的电子银行,但它不可能永远将业务局限于这部分客户上。随着传统征信报告行业持续放任获取优质评分的客户资源从手缝中溜走,Kreditech更可能像其它竞争者一样将分析扩展到优质借款人身上。


“Kreditech最近对200万名评分客户进行了事后检验,结果发现大数据技术与传统数据的结合产生了比行业标准还要低的违约率,证明了该项技术的可行性;一个针对2012至2014年间所有发放的贷款的内部事后检验也发现大数据技术与征信局数据的结合能使其产生最高的收益回报率,”团队在一份报告中这样阐述到。


有人会质疑说,Kreditech在其算法中仍然使用了传统征信局的数据和评分啊。是的没错,其他竞争者也是这么做的,但实质在于便利性而非必要性。使用征信局的评分或者数据是一种简便的捷径而且整个行业都接受这种算法。同时,也无需从其他贷款发放者手中购买数据。但是毫无疑问,征信局竞争者们已经在某种程度上准备(即使还未开始)跳过征信局数据采集这一步,直接从其他贷款机构方面收集数据。但截止到目前为止,征信局依然代表着历史借款人行为的最佳数据来源。即使如此,征信局自己却未能将这些数据物尽其用。


“Kreditech的数据表明老旧的简单评价信用分数的方法对于世界2/3的人群起不到作用,”Kreditech的一份报告中这么认为,“事实上,数据显示如果只使用征信局的数据会产生负的回报收益率。单一使用大数据就会产生四倍于其绝对值的正收益。两者的结合则可以将每一个决策过程的利益最大化。”


那么Kreditech团队到底是怎么通过摆弄数字来实现比征信局更好的风险分级呢?在同一份报告中,他们是这样解释的:“Kreditech团队使用自己校准的算法,引入了其他方面的数据如社交媒体数据等来加强大数据方法对潜在借款人的发掘,建立起一个自动预测决策模型来第一时间内决定要不要批准贷款,以及判断如果批准了客户会不会还贷。该自动决策的过程结合了机器学习的算法。最终结果是一个能吸引更多客户并引导产生附加数据,进一步改善自动评分算法的简单技术。基于15000个数据点,Krediteach的专属技术允许贷款发放者获取、识别客户,评分,放款并且追加销售这一系列流程在短短几秒钟内就可实现。”


你可能听过我在前面几篇文章中警告征信局他们面临着消失或者被替代的风险,这一次的警铃会更响一点。对于传统征信机构而言,他们应该尽快掌握大数据技术并建立比现有方法更为可靠有效的评分算法。时钟在滴答作响,如果他们在改进业务上拖延更久的话一切就可能太迟了。


原文发布时间为:2015-04-29

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
编解码 自然语言处理 开发者
复刻Sora有多难?一张图带你读懂Sora的技术路径
OpenAI发布了视频生成模型Sora,最大的Sora模型能够生成一分钟的高保真视频。同时OpenAI称,可扩展的视频生成模型,是构建物理世界通用模拟器的一条可能的路径。
|
分布式计算 Java Hadoop
三台阿里云服务器搭建完全分布式Hadoop集群
三台阿里云服务器搭建完全分布式Hadoop集群
2039 1
三台阿里云服务器搭建完全分布式Hadoop集群
|
人工智能 安全 Cloud Native
|
网络协议 安全 应用服务中间件
服务器最大支持多少链接数
【10月更文挑战第27天】本文探讨了单台服务器最大支持的链接数,分析了TCP链接标识的四元组、文件句柄限制、端口号范围及多IP绑定等技术细节。结论指出,理论上的最大链接数受制于文件句柄和内存,而链接接收端的链接数可视为无限大。
485 0
|
机器学习/深度学习 自然语言处理 PyTorch
从零开始构建nlp情感分析模型!
本教程介绍了如何使用PyTorch和Hugging Face的Transformers库构建一个情感分析模型。主要内容包括导入所需库、读取训练数据集、加载预训练的BERT模型和分词器、定义情感数据集类、划分训练集和验证集、创建数据加载器、设置训练参数、训练模型、评估模型性能以及定义和测试预测函数。通过这些步骤,可以实现一个简单而有效的情感分析模型。
1047 2
|
Oracle 关系型数据库 数据库
Docker安装Oracle_11g数据库并配置
Docker安装Oracle_11g数据库并配置
944 0
|
供应链 数据挖掘 Java
电商API接口介绍
‌电商API接口‌是指一组用于访问电商平台中数据的编程接口,通过这些接口,开发者可以以编程方式获取商品信息、订单信息、用户信息等,实现电商平台数据的对接和交互。
423 5
|
SQL 关系型数据库 MySQL
数据库介绍与MySQL详细介绍
数据库是信息科技领域中不可或缺的一部分,它们在我们日常生活中扮演着重要的角色,从手机应用到云计算,无处不在。在本篇博客中,我们将深入探讨数据库的基本概念以及MySQL这一流行的开源关系型数据库的详细信息。不需要数据库专业知识,我们将从头开始,向您解释这些复杂的概念。
658 0
|
SQL 关系型数据库 MySQL
SQL Server、MySQL、PostgreSQL:主流数据库SQL语法异同比较——深入探讨数据类型、分页查询、表创建与数据插入、函数和索引等关键语法差异,为跨数据库开发提供实用指导
【8月更文挑战第31天】SQL Server、MySQL和PostgreSQL是当今最流行的关系型数据库管理系统,均使用SQL作为查询语言,但在语法和功能实现上存在差异。本文将比较它们在数据类型、分页查询、创建和插入数据以及函数和索引等方面的异同,帮助开发者更好地理解和使用这些数据库。尽管它们共用SQL语言,但每个系统都有独特的语法规则,了解这些差异有助于提升开发效率和项目成功率。
1625 0
|
关系型数据库 MySQL 数据库连接
Django(四):Django项目部署数据库及服务器配置详解(MySQL)
Django(四):Django项目部署数据库及服务器配置详解(MySQL)
1976 11