PINTEC集团璇玑公司CEO郑毓栋:人工智能的金融应用,一旦赌错万劫不复

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 人工智能在金融领域的应用是一个很大的问题,一直受到业界的关注。璇玑公司就有一套这样的智能理财系统,既使用了传统的数据统计方法,也使用了支持向量机这样的机器学习模型。机器之心对璇玑公司的 CEO 郑毓栋进行了专访,探讨人工智能在金融领域的应用。

郑毓栋,璇玑公司 CEO。拥有 10 余年跨国银行的经验,在财富管理,金融产品开发,高净值客户管理方面有丰富的经验;郑毓栋先后担任渣打银行中国投资策略及咨询总监,产品总监以及花旗银行新加坡商务客户市场及产品总监;并且广泛在媒体接受采访,倡导资产配置理念;郑毓栋拥有新加坡国立大学经济学硕士和计算机科学学士学位。


关于璇玑的数字化资产配置系统


我们以金融逻辑为主,基于马科维茨资产组合理论,然后将机器学习和其他方法作为一种支持。


机器之心:能介绍一下我们的智能理财系统吗?


郑毓栋我们建立了一套为机构客户提供技术服务的数字化资产配置系统,再由持牌的机构根据这套系统提供大众使用的智能化的理财产品,目标群体是中产阶级,那我们的系统有三个特点,1)交易不频繁。2)交易策略容量要很大。3)对时间不敏感。所以,我们数字化资产配置系统要解决的问题跟传统意义上的绝对收益基金是不一样的,那对应的解决方案也就不一样。他们是已经有了一套非常完备的交易体系,比如说高频交易这种技术能力,然后在这个基础上求得一种方法求得一种解决方案,比如说用机器学习去做高频交易。


但我们做的系统是为广大中产阶级所用,所以不会太过依赖于绝对收益 α,但像文艺复兴西蒙斯所说,任何 α 策略的交易其实都处在一个非常短暂的区间。所以对于我们要解决的问题,他们这种方法肯定不适合。那我们就回归到金融逻辑上去解决这个问题,基于资产配置理论。该理论是马科维茨在 1952 年提出的,后续又有许多人对这个模型做了改进和加深。它最大的好处就是风险分散,所以特别适合家庭理财,能够根据你的风险承受能力给你求得一个风险收益的最优比。


这样的话,你就永远不会出现像以前 LTCM(美国倒闭的长期资产管理公司)出现的问题,一旦错了就万劫不复,这是任何一个普通家庭都没有办法承受的。对我们来说,要为中产家庭解决一套解决方案,最佳模型就是用马科维茨这套方式,进行风险和收益最优的一个测算。使得用户在长期的一个过程当中,他能够得到一个稳健和长期的收益。在这个理论基础,我们了一些变化和改进,比如说解决均值回归周期很长的问题,我们会通过数理统计和机器学习的方法在这个方面加以一些改进,这也就是我们和今天市面上其他模型不一样的地方。


最近一段时间,智能投顾这个说法在中国有被滥用的趋势,很多公司都声称在开发智能投顾系统。但我要提醒的是,国际上通行的 Robo advisor 概念和国内近期的智能投顾概念有很大不同。国际上的 Robo advisor 是指以马科维茨的资产配置理论为基础,以经济学上严格定义的大类资产为投资标的,以 ETF 为投资工具,运用量化的方法和计算机技术,帮助用户自动配置资产,并进行动态再平衡的系统。这套系统追求的是贝塔收益,长期的稳健的收益。


而我们在国内看到的很多所谓的智能投顾,根本跟这个理念是背道而驰的,他们追求的是短期绝对回报,投资标的千奇百怪,甚至包括了大量的非标资产,并有资金池嫌疑。此外,在国内的语境下,「投顾」有特殊含义,很多情况下是指给客户提供个股投资建议的顾问,需要有证监会发放的牌照。


因此我们认为国内的「智能投顾」并不能跟国外的 Robo advisor 划等号,这也是为什么我们把自己的系统称之为「数字化资产配置」。我们公司只为机构客户服务,为他们提供整套数字化资产配置的解决方案,再由这些持牌的机构为个人用户提供合规的产品。


这也是我们跟市面上绝大多数公司不同的方面。个人用户很难判断一套系统的技术实力高低,更容易被市场营销所影响,而机构用户则相对专业的多。


机器之心:智能理财首先需要的是数据,我们用到的数据主要是哪些?在获取数据过程中是否也存在数据拿不到或拿不全的问题?    


郑毓栋:我们目前的数字化资产配置系统用到的数据主要三方面,首先是所有大类资产在一个市场环境下的数据,以及和它底层产品的数据。我们回溯了接近十五到二十年的价格和走势。其次是各种反映经济基本面的全球宏观数据,它们作为很重要的因子来影响资产面价格。第三是用户数据,随着用户对我们产品的持续使用,我们会收集越来越多的用户数据,这主要是用来进行用户画像,比如判断用户的风险承受能力。


数据拿不到,或者数据不全,也是是一个问题。首先,所有公开的数据我们尽量收全。比如国家统计局公布的经济数据,其实都很全的,我们可以尽量拿来。第二,自己本身这套系统也很重要,是指本身交易系统提供的数据和客户本身的交易数据,如果慢慢积累的话,也会有一定的解释性。只要样本足够大,虽然拿不到全数据,但拿到足够的样本数据也是可以解释的。


机器之心:在收集数据时,除了类似于像失业率之类的传统数据,会不会把一些事件进行量化加到模型里,比如金融分析工具 Kensho 的搜索引擎会自动将发生的事件根据抽象特征进行分类。你有没有考虑过这方面?


郑毓栋:这是件很有意思的事情,这个对数据的不连续性要求更高了,噪音是也更广了,我们这块还在研究,还处在实验阶段。我觉得这个方向是对的,因为行为金融学是比较普遍的存在于市场上的。我们为了求得最小误差要解决过度拟合的问题。因为你需要采取的数据更广,那问题的复杂度上升了好几个量级。跟我们拿一些经济数据和基本数据来做完全不可同日而语,这个东西有太多未知的可能。但终归我觉得它是一个正确的研究方向。


机器之心:璇玑的智能理财产品在哪些地方用到了人工智能和机器学习等相关技术?


郑毓栋:具体来说,我们的数字化资产配置系统主要是预测某一大类资产在未来的波动,它可能是向上、向下或者平坦,所以这就成了一个非常典型的机器学习问题。当我有一个均值回归的基础值,有了一套外面大的基本面数据时,怎么来有效地做一个判断,它的这个值是一个向上还是向下的趋势。那我们的做法是在这个程度上机器学习还是起着一种辅助作用,而均值回归是一个基础。我们假设一个人拿着绳子牵着一条狗,人作为价值,而狗是价格,狗可以跑来跑去,但是它要一直围绕着人。所以在均值回归这种情况下,一个基础的考量是我们需要判断绳子的长度和绳子在前在后在左在右,再做一个小规模纠错。这样保证的是什么呢?我们不会出现赌博的情况,整个模型的一个大基础是我不赌博,我一定要进行风险分散。机器学习发挥的作用是可以去训练它,去获得经济变量对于大资产的变化跟走势。


值得注意的是,我们不是依赖机器学习模型这一种方法,而是要采用多模型的方式,除了支持向量机(SVM)这样的模型,还要利用传统的数据统计方法,包括事件训练模型、回归模型等。我们将这些方法综合起来给一个评分,对资料做完分类之后做预测,经过实证研究之后再拿给客户。


对这几种模式进行混合,同时对它的上下限进行一个有效的风险控制,以防止整个预测是错误的。机器学习其实在金融学上还有一些风险存在,最大的风险就是过度拟合的一个问题。冯•诺依曼说过一个很有意思的话,用四个变量我就能够拟合出一头大象,而用五个参数我可以让它的鼻子摆动。这说明从拟合的角度看,如果你给我足够多的变量,我是能够解释一切的,但这是否符合金融自身的逻辑,还存在疑问。所以,我们会选择支持向量机的原因在于它是一个已知证明的理论,我不需要非常精确涨跌多少,我需要的是一个分类和信号,上、下或者是平的信号,这是一种模糊的精确。其次,我可以把一些有效的变量投射到高维,这样就把非线性的问题变成了一个线性问题,然后去求解。所以,我觉得对金融问题来说,这样一种模式可能是比较有效的机器学习应用方法。

 

机器之心:根据以往测试,这套系统的表现如何?


郑毓栋:我们的产品中,风险和收益是相匹配的,最积极的组合大约有 17% 的年化回报,波动率大概在 15% 左右。最保守的组合的波动接近于 0 ,年化回报在 6%-7%。我们应该是比较好的把马科维茨的模式解释了出来,你追求越高的回报,就要承担越高的风险。我们大概有一个标准,六级的风险模型。我们看到每一个模型的收益和长期回报都是不断上升的,波动也是在往上走的,然后让客户自己选择。我们还做了数据可视化方面的工作,因为很多人看不懂波动这种统计学上面的东西,所以我们会把十年最大回撤这类数字展示给他看。最积极组合十年的最大回撤大概在 15%-16%,在金融海啸时到现在,最保守那个组合的最大回撤是 0.7%,所以几乎是直线,这个很明显地让大家看出,你愿意付出什么样的代价,就得到什么样的回报。


机器之心:璇玑的数字化资产配置系统的模型与那些做量化交易的模型主要有哪些区别?

 

郑毓栋:我们这个是相对透明的一种,因为很多量化的东西其实是很黑箱的,交易的是什么你不知道,交易的逻辑你也不知道,但我们这个相对来说比较简单,因为我们的基础是马科维茨,非常公开透明。我们其他任何改进都是基于马科维茨的一个补充。


首先,量化交易追求的是绝对收益 α,因为这种交易机会转瞬即逝,所以公司不会把模型公布出来。我们不做任何形式的套利,所以也不怕别人来套利。我们的初衷是想做一个符合广大中产投资人的一个资产配置的模型。其次,其他策略在达到一定程度会面临容量的问题,最大的策略,我觉得上亿也就了不起了,很少有过十亿、百亿交易策略的容量,唯一有这么大容量的交易策略就是追求 β 的这种资产配置。所以这也是为什么我们觉得这块的一个潜力是非常大的,因为这个模型出来以后,就是千千万万的人都能用。


人工智能在金融领域的应用和影响


整个金融是由一连串的信息构成,怎么将这些不连续的信息,甚至是有噪音的信息进行过滤、整理、辨别、分类,然后传递给用户,科技金融在这方面很有潜力。


机器之心:你对于人工智能应用于金融业如何看待?


郑毓栋:人工智能在金融领域的应用其实是一个很大的问题,一直也是业界所关注的,金融适不适合使用机器学习?到底什么样的问题适合用机器学习来解决?我们的看法是,在应用机器学习之前,要首先有个大的金融逻辑,有自己对金融理论的思考。目前业界有种做法是数据说话,把数据扔进去,我未必能解释这个数据展现的是哪种金融理论和逻辑,然后用输出的结果去预测。我们不是特别赞同这派,因为数据有很多偶然性,金融市场跟下棋不一样,下棋是一个规则清晰、信息完备、博弈双方很明确的行为,所以会得出一个没有噪音的结果。而金融市场充满噪音,博弈双方有特别多的偶然性。因为我们都是金融背景出身,而非统计和工程背景,所以在这方面会有一些基本的想法——进来的数据、使用的模型和方法要符合金融本身的逻辑,这样才能谈的上是构建一个有效的模型。因此,机器学习是一个方法,怎么用取决于你的模型。


马科维茨的传统理论被证明是一个确实有效的方式。你不能说加了机器学习,反而使它的理论变得不有效,这是不对的,所以我们在这方面做了很多大量的测试和工作。我们是运用机器学习,但还是认为应该以金融理论为主,将机器学习作为一种支持。


机器之心:现在有很多公司会利用人工智能技术去预测股价,你对于这个方向有何看法?


郑毓栋:这方面的学术文章一直没有断过,都是用这个人工智能预测股价,这个是最多的。为什么这些学术成果到现在都没有运用?其实我觉得最大一个问题就是,很多机器学习专家并不是金融出身,他发现了一种数据模型或者学术方法,但没有想到怎么运用到金融领域。而且股价相关信息的噪音是最多的,仅仅拿着过往的走势预测未来是对的。这么多年来,没有出现一个有效的可以预测股价的方法,这个问题是否是机器学习完全能够解决的?这是值得大家思考的。


今天有很多工程、统计方向的人,觉得人工智能在金融上很有应用,纷纷往这个方向转,希望求得金融的灵丹妙药,我觉得在这个方向上还是要非常注意的。就像我之前所说,一旦赌错方向就是万劫不复。


我们在这方面还是非常谨慎的,用多模型、多策略,包括传统的统计学和机器学习来作为应用,对它的上下限做了严格的规定和控制。而且我们所使用的大类的基本面数据,比如说M2、CPI、失业率、房价、PMI等,用这些指数进行大类资产的预测是可以被解释的。我们认为比较靠谱的方式去做机器学习。我们用了大概四五年的数据去做训练,接下来再学习十几年,并且在它上面加了非常严格的纠偏和纠错机制,不让它每次做太多博弈。这是在做风险控制,所以还是比较可信的。


机器之心:Kensho 创始人 Daniel Nadler 说,「我们正在以破坏大量相对高薪工作为代价来创造极少数的更高薪工作。」你认为人工智能技术在金融领域的应用将如何影响从业人员?


郑毓栋:其实这个很有意思,你看美国市场,金融市场发展了这么多年,越来越有效。大家就发现美国基金经理主动管理的超额收益几乎为零,跑赢大盘的人很少。整个公募基金业在美国有越来越萎缩的感觉,在这种情况下,我们看到像Vanguard Group这样的公司,发展的反而很好。它是全球仅次于贝莱德的第二大被动投资基金,多年来以做ETF为主,秉承的理念就是基金经理最终的主动管理能力是收敛的,无法提供超额回报,所以我做ETF就好。而国内还在谈明星基金经理,好像找到一种点金术似的。所以我觉得,第一,点金的人肯定是很少,点金的模型也是很少的。因为整个市场越来越有效的时候,只有最厉害的人或者交易程序才能捕捉到α。第二,当α变得越来越少的,你就不需要这么多人在市场上研究策略。所以你上面提到的那个趋势,我是相信的。


机器之心:除了智能理财,机器学习等人工智能还将应用于哪些金融领域?


郑毓栋:首先,信贷是一个很大的应用领域,会是机器学习大放异彩的地方。它可以对人群进行很好的划分和分类判断,什么样的人可能不违约,什么样的人可能违约,什么样的人违约率高,等等。机器通过反复训练是可以给我们以指导的。我觉得信贷领域是大数据能够解决的一个问题。其次,在反洗钱等金融安全方面,机器学习也能有很好的应用。它跟筛选垃圾邮件很像,我判断这是不是一笔有洗钱嫌疑的资金交易,今天是用人工通过一些固定规则把它抓出来,但是这个规则也许本身是可变的。使用机器学习,你把大量信息输送给它,它就可以自动抓到。金融安全现在在全球银行的交易成本也越来越高,因为所有的监管都对这快看的非常紧。所以在这方面会有很大的发展可能。总值,任何对概率有需求、需要进行分类判断的都可以用到机器学习。


我们璇玑公司隶属于 PINTEC 集团,集团旗下还有读秒智能信贷公司、积木盒子等。不久前我们的读秒公司公布了一个数据,他们的智能信贷系统一个月要处理 50 万笔贷款,6 个人做这个事,当这个业务量翻几倍以后,也只需要这几个人。如何是传统银行,动辄是成千上万的信贷员在做这个事情。我们的大数据团队会帮助信贷做用户分析和画像。这就让信贷业务摆脱了人工的限制,实现了非线性增长。


机器之心:高盛之前一直大规模招聘机器学习人才,也在一次投资者会议上表示,我们不是一家金融公司,而是一家科技公司。另外国内也有很多金融公司表示在越来越多的使用机器学习,你如何看待这种现象?


郑毓栋:其实科技投入是件好事,尤其是大机构。从robo advisor来说,我们去年很明显地看到,高盛、贝莱德和富达等大机构都非常深度的进入了这个领域,说明这个领域本身是大家非常关注的一个方向。那从深度学习的角度,它有这么多的应用,大机构肯定在研发上面对它非常感兴趣,这个是可以理解的。我们把自己定义成一家科技金融公司,我们认为,科技金融除了深度学习以外,其实还有很多技术,比如区块链,这是一项非常庞大的研究工程。海外很多东西拿出来是实实在在,背后有很深科技的基础存在,而且通过了实证,确实帮用户解决了问题。而国内很多公司跳出来,很多时候还处在一个表面阶段。


机器之心:除了人工智能,还有哪些技术在金融领域会有比较长远的应用?


郑毓栋科技金融将对金融行业产生很大推动,这点我是深信不疑的。比如说基于生物信息的个人身份认证,还有去中心化支付,未来会在很大程度上帮我们节省交易时间和交易成本。还有比如Kensho这类公司,怎样把金融知识集中化随机的提供给用户,而不依赖于人工提供给用户,这也是一个很大的应用场景。最终来说,整个金融是由一连串的信息构成,怎么将这些不连续的信息,甚至是有噪音的信息,进行过滤、整理、辨别、分类,然后传递给用户,在这方面很有潜力。


公司介绍:


璇玑是PINTEC 旗下的数字化资产配置解决方案提供商, 由财富管理业资深人士、金融工程师、大数据科学家和互联网科技团队联合打造, 以现代资产组合理论为基础,运用数量化模型、机器学习辅助、云计算和程序化交易等手段, 为持牌的机构用户提供个性化、智能化、自动化的一整套数字化资产配置技术解决方案。


PINTEC集团介绍:


PINTEC 是一家智能金融服务集团。我们专注于大数据处理和金融科技研发,为企业和消费者提供最高效的智能金融服务和解决方案,用科技缩短人和金融服务的距离,促进金融服务平等化,让金融不再高远冷漠。


PINTEC旗下公司包括:读秒智能信贷公司,璇玑数字化资产配置公司,积木盒子网贷信息中介平台,虹点基金销售公司,麦芬保险经济公司,企乐汇企业征信平台等。


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
23天前
|
人工智能 运维 物联网
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。
|
19天前
|
人工智能 算法 前端开发
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架,支持多设备连接、高效模型集成,助力开发者快速构建复杂的多模态代理应用。
161 72
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
|
5天前
|
人工智能 自然语言处理 搜索推荐
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
68 23
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
|
13天前
|
人工智能 自然语言处理 JavaScript
微软开源课程!21节课程教你开发生成式 AI 应用所需了解的一切
微软推出的生成式 AI 入门课程,涵盖 21 节课程,帮助开发者快速掌握生成式 AI 应用开发,支持 Python 和 TypeScript 代码示例。
198 14
|
1月前
|
机器学习/深度学习 人工智能 算法
AI在体育分析与预测中的深度应用:变革体育界的智能力量
AI在体育分析与预测中的深度应用:变革体育界的智能力量
125 31
|
11天前
|
人工智能 开发者 Python
Chainlit:一个开源的异步Python框架,快速构建生产级对话式 AI 应用
Chainlit 是一个开源的异步 Python 框架,帮助开发者在几分钟内构建可扩展的对话式 AI 或代理应用,支持多种工具和服务集成。
90 9
|
27天前
|
人工智能 运维 负载均衡
智能运维新时代:AI在云资源管理中的应用与实践
智能运维新时代:AI在云资源管理中的应用与实践
149 23
|
20天前
|
机器学习/深度学习 数据采集 人工智能
人工智能在变更管理中的应用:变革的智能化之路
人工智能在变更管理中的应用:变革的智能化之路
42 13
|
17天前
|
机器学习/深度学习 存储 人工智能
AI实践:智能工单系统的技术逻辑与应用
智能工单系统是企业服务管理的核心工具,通过多渠道接入、自然语言处理等技术,实现工单自动生成、分类和分配。它优化了客户服务流程,提高了效率与透明度,减少了运营成本,提升了客户满意度。系统还依托知识库和机器学习,持续改进处理策略,助力企业在竞争中脱颖而出。
54 5
|
23天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能在客服领域有哪些应用?
人工智能正在彻底改变着传统客服行业,它不仅拓展了业务边界,还推动着整个行业向更高效、更人性化方向迈进。
59 7