由弗罗里达州立大学研究者领导的开创性项目在自杀预测方面取得了巨大的进步,使得临床医生可能预测最多长达两年之后的自杀,准确率达到80%。
弗罗里达州立大学研究者Jessica Ribeiro急切希望解决这个残酷的问题:每天有120位美国人自杀,一年有近45000人。Ribeiro将在临床心理科学杂志上发布她的文章:利用机器学习预测自杀倾向风险。
------------------
【福利】阿里云在线峰会第三场
3月9日,6位阿里技术专家,
4位大数据应用专家,
从技术到案例,直播剖析
时下最前沿大数据玩法,
点击文末阅读原文
免费限时报名
报名详情见文末
------------------
该研究得到了一个十分吸引人的结论:机器学习能预测最多两年之后某人的自杀倾向,准确率高达80%~90%。该方法在越接近某人的可能自杀日期时还会变得更加准确,比如针对一般的医院病人,在试图自杀的前一周准确率攀升到92%。
“该研究证明我们可以准确预测自杀倾向”,Ribeiro说道,“我们可以准确预测较长时间的自杀,但是在接近事件发生时间时能得到更好的预测。根据该研究我们还知道,风险因子同样随时间变化。”
Ribeiro的研究代表了极度需求的自杀倾向预测方面的重要进展。弗罗里达州立大学副教授Joseph Franklin最近的研究指出,50年的自杀倾向预测其实并没有取得任何实质上的进展。传统的用于预测自杀行为的风险因子,如抑郁,压力或者药物滥用,只能得到比随机猜测好不了多少的准确率。世界上最高明的专家对自杀倾向的预测准确率也不过跟扔硬币差不多。
“这实在令人悲伤”,Ribeiro说道,她曾与Franklin一起进行上文研究,“聪明的人们五十年的研究并没有改变什么,我并不是说机器学习是灵丹妙药,但这些技术和改变真的确实能够推动本领域的进步。”
Ribeiro的项目源自Franklin的合作。她和Franklin以及范德堡大学医学中心的Colin Walsh成功拿到了包含2百万田纳西州病人的电子健康记录的数据库。研究团队对电子健康记录进行了细致的梳理,鉴别出3200人曾经试图自杀。
根据数据库中包含的可能导致自杀行为的详细病史,机器学习对此进行检查,学习因子的组合方式,以最大化自杀倾向预测的准确率。“机器对风险因子的最优组合方式进行学习,”Ribeiro提到,“最重要的是这种方法和众多变量作为整体交互的机理。这类工作让我们能够应用能处理大量数据的方法,并将这些病历信息减少到对临床有用的程度。”根据这些数据,能开发针对自杀行为风险的预警系统。比如,系统给每个人设置“红灯警告”或者“风险得分”,这样当他们由于急性病症去医院的时候,急救室医生能发现评估的自杀风险,立即采取相应的心理疏导。
“就像你有心血管风险评分,你就会得到一个自杀风险评分,医生就能据此决定接下来的治疗步骤。”Ribeiro说。
通常,这些后续步骤并没有发生。研究显示60%~90%的人们在自杀的过去一年里曾经拜访他们的医生,但医生们并没有看到自杀的风险。
国内的卫生保健系统框架正在建立,系统包含的电子记录将能被机器学习分析以鉴别自杀风险。但为了研究,可能会对数据进行修正,这也是未来的一个挑战。更多的组织如美国军方和美国退伍军人事务部已经准备将机器学习方法应用于他们自己的电子健康记录了。Ribeiro现在正与弗罗里达州的军事自杀研究协会一起进行研究,利用机器学习鉴别自杀风险。
自杀率在过去一个世纪中居高不下,甚至在1999年以后还有所上升,但Ribeiro对自己团队的工作抱有期望,相信将会达成伟大的目标:“研究项目的重点是能够实现准确的所有人在任何时刻的自杀风险检测。现有方法可能不是最好的,但我认为如果更多的研究者关注这一类方法,我们将能看到自杀行为的显著下降,长此之后实现自杀死亡率的下降。这一天不会很远。”
原文发布时间为:2017-03-05
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号