专注分析40年,SAS如何看待数据 | 直击SAS 2018全球论坛

简介: “如果把神经网络的层数从10增加到50,输出结果可以更好一点吗?……再高一点呢?” 美国丹佛市当地时间4月8日晚,在SAS 2018全球论坛(SAS Global Forum 2018)的开幕演讲中,年近八旬的SAS创始人兼CEO Jim Goodnight,与SAS年轻的数据科学家Jonathan一起,合力上演了一幕程序员的办公室日常噩梦: 焦急等待结果的挑剔老板,和尝试各种模型来输出更好结果的绝望程序员。

“如果把神经网络的层数从10增加到50,输出结果可以更好一点吗?……再高一点呢?”

美国丹佛市当地时间4月8日晚,在SAS 2018全球论坛(SAS Global Forum 2018)的开幕演讲中,年近八旬的SAS创始人兼CEO Jim Goodnight,与SAS年轻的数据科学家Jonathan一起,合力上演了一幕程序员的办公室日常噩梦:

焦急等待结果的挑剔老板,和尝试各种模型来输出更好结果的绝望程序员。

278b609ee812c626243ea06e07ad3d250b0bf870

SAS创始人兼CEO Jim Goodnight在SAS 2018全球论坛开幕演讲中演示SAS®ViyaTM最新版本

面对6300位来自世界各地的SAS用户,SAS®ViyaTM最新版本在Jonathan的操作下显示出了强大的机器学习能力:数据可通过拖拽直接载入;不同模型、甚至神经网络层数的调整都可以通过点击实现;输出只需要几秒钟;结果的优化从面板显示的数字上一目了然。

而出现在开幕演讲中,这一场景的设计远比展示最新产品效果更加意味深长:它代表着SAS正在扩展自己的用户群体——不再只是传统的程序员、科学家,它瞄准的是不太懂编程,但看好并急于进行数据和人工智能转型的公司高层。

斯坦福大学教授李飞飞曾公开表示:人工智能、机器学习仍然是一个进入门槛高的领域,需要大量专业知识和资源,而很少有公司自己能负担得起这些资源。今天,虽然AI能为企业提供无数的益处,但由于资源稀缺,多数企业还无法开发个性化的模型。

SAS®ViyaTM最新版本在算法自动化上的设置显然是奔着解决这一痛点而来。

本次大会上,SAS表现了对AI和机器学习自动化程序这一新聚焦点的全面拥抱。SAS分析产品部负责人Saurabh Gupta在次日发布了ViyaTM最新版本,并解释了其一系列新特点:AI分析植入和自动化;更加透明的结果输出;更好地数据治理功能;用户体验地提升;更加开放,支持更多分析工具。

来自加拿大的SAS资深用户、Mcdoougall Scientific公司的副总裁John Amrhein对这最新版本ViyaTM操作的“便利性(ease)印象深刻:“支持各类数据格式,而且通过拖拽点击就可以实现各种模型的调整,非常高效。”这一友好的用户界面可谓SAS本次全球论坛中的最大亮点。

0d3f7341de605bdf62c7afd486647805b075e1c2

2018年4月8日至11日,SAS 2018全球论坛在美国丹佛召开

对于自动化,除了便利性,参会用户对于最新的分析工具也有一些反思。“太过简单的工具也可能会让人忽略数据的重要性”,加拿大的独立咨询顾问、SAS资深用户Peter Eberhardt非常认可ViyaTM产品的优质性能,但也向大数据文摘表达了自己的担忧:很多用户因为工具太简单,反而会不认真思考数据的质量。

“我曾经见过一个广告领域的客户,输入的数据真的非常差,但是因为工具好所以跑出来的模型很棒,客户会因此觉得数据其实也不错。”

“好的数据非常重要。”正因此,Jim Goodnight在采访中一直强调数据清洗和管理的重要性,而他自己也一直以一位“统计学家”自称。

专注数据四十年,SAS分析经验的全球化输出

尽管扮演了一位“技术盲”的挑剔老板,Jim Goodnight的数据分析能力绝不弱于他身边的数据科学家:四十多年前,他在美国北卡罗来纳州立大学进行一项农业数据研究时,开发了一款数据分析软件,并基于此,创立了SAS公司。

7ca6f9c25a26e311ec78ab7000d6b903b1306b8a

SAS创始人兼CEO Jim Goodnight

40多年来,SAS的整体营收保持了持续的增长。即使在开源软件大行其道的今天,略显昂贵的SAS依然是全球多数金融、医疗机构、甚至政府的首选数据分析软件。根据IDC的数据,SAS占全球高级和预测分析市场30.5%的份额。

经历了数据写在纸上的时代,到大数据、云存储,再到今天的机器学习、人工智能,SAS尽管经历了多次技术探索方向的变更,作为一家专注“分析”40余年的老牌公司,其在行业内积累的丰富数据和业务经验鲜有匹敌者。而在算法和模型愈加“自动化”的今天,这些宝贵的行业知识积累显然比技术更难复制。

这些经验也是SAS开拓国际市场的秘密武器。

博雅融创软件技术有限公司是SAS在中国的重要合作伙伴,其总经理陈建文告诉大数据文摘,中国客户非常看重SAS在数据分析领域的先验经验。

“我们正在和中国一些省市的疾控中心合作,开展疫情相关的数据分析项目,而SAS之前协助美国相关部门进行了很多案例积累。尽管数据不同,但是业务经验、模型都可以直接借鉴,这是客户非常看中的。”

开放包容,和更年轻的数据科学家一起成长

但是,SAS也面临着所有老牌巨头同样的挑战:新生的数据分析工具。

从丹佛向北飞两小时,你将从下着雪的西部到达阳光普照的硅谷。这里是新生互联网巨头Facebook、Apple、谷歌等的大本营,也是一批数据科学、人工智能创业公司的诞生地。在这些公司中,新生代的80、90后数据科学家正在占据技术世界的主力。尽管SAS的名字依然响亮,这些动手和学习能力都极强的程序员更乐于自己探索开源的程序包。

“开源软件更便宜、更酷,自己开发的应用也更顺手。”来自Facebook的一位90后数据科学家告诉大数据文摘,“SAS是挺好用的,但是对个人使用来说太贵了”。

价格太过昂贵显然也是SAS现任CTO Oliver Schabenberger本次SAS全球论坛中,受到最多质疑的地方。

0fd3aecc9d45b6e8ea4178674c7726d10c4dc551

SAS CTO Oliver Schabenberger在SAS 2018全球论坛演讲

采访中,Oliver没有否认新出现的开源软件有自己的优势,尤其是在价格方面。

“(开源软件)确实更便宜,我们也希望我们客户有更多选择。”面对质疑,Oliver的回应相当坦诚,“但你不能抛弃价值只谈价格,我们相信SAS的品质,我们也在不断改善产品应对挑战。”

近年来,SAS也确实有一些转而使用开源软件的客户。

亚洲最大的银行星展银行DBS是SAS的老客户,其首位首席分析官(Chief Analytics Officer)Sameer Gupta告诉大数据文摘,除了SAS,DBS之前也曾尝试使用开源软件R、Spark等以确保产品的多样性

为应对用户对多样性产品的需求,2016年,SAS整合了自身的分析能力,推出了通用部署的计算平台ViyaTM:这是一个开放的、支持云计算方式部署的内存计算平台,面向企业内部提供一个单一、开放和统一的分析环境。

作为一个开放的架构,ViyaTM期待可以满足所有分析专业人士的需求,其支持包括REST API、SAS语言、Python、Java、R和Lua等方式的数据操控和分析开发。

中科聚信是SAS目前在中国较为重视的合作伙伴,其创始人兼CEO马占军告诉大数据文摘,相比无人维护的开源软件,SAS的产品会更加稳定专业,这是银行、保险公司、医疗机构这种公司非常看重的,这样的机构根本无法承担开源软件的不稳定性带来的风险。

而为了抓住数据分析领域的新生力量,SAS对高校和年轻人的投入也一直不遗余力。

Jim Goodnight告诉大数据文摘,SAS与全球非常多的高校、教授建立了持续的合作关系,并向学生提供优惠价格下载软件,每年都有成千上万的高校学生从中受益。

当然,抓住新一代数据分析者的关键不只是导师需要或者免费的软件,能切实用最前沿的技术做炫酷的项目,才能真正征服这群“最聪明的脑袋”。

“数据为善”

在主论坛的keynote演讲上,两个有趣的例子把SAS“数据为善(Data for good)”的主题体现到了极致。

WildTrack:用脚印识别保护濒危野生动物

SAS 2018全球论坛中提到了一个人工智能有趣的应用场景:使用动物的数字足迹来识别濒危野生动物物种。

野生动物的脚印是观察濒危种群并实施保护的起点,通过脚印,工作人员可以确定物种的性别,有时也会鉴别年龄。

之前,这样的脚印信息只能靠当地志愿者人工发现、拍照,并手动录入数据,效率极低,数据的缺失也让研究人员很难确切地了解哪些物种需要监测。

SAS将AI图像识别技术应用于此,并为此建立了一个野生动物的脚印数据库项目。

在这一数据库中,SAS工作人员已经为15种不同的物种开发了相关软件及其算法,包括黑犀牛,白犀牛,孟加拉虎,阿穆尔虎,和北极熊等动物的脚印数据都被收录其中。

通过收集这些数据,工作人员可以更好地确定濒危物种栖息地物种的数量和分布情况,以便实施保护方案。目前,识别准确度已经达到了90%以上。

SAS Graphics Accelerator移动端上线:让盲人通过音乐感知图表

SAS Graphics Accelerator的移动端应用是本次SAS 2018全球论坛又一惊艳发布:通过和苹果合作,SAS Graphics Accelerator可让盲人通过音乐的形式使用和理解图表。

在大会上,来自SAS的盲人体验师现场展示了如何在手机上“观看”一副折线图。在app中,我们可以通过三种方式阅读图表:由屏幕阅读器读取图形描述;将图形转换为易于阅读的表格;或者获得图形的声波表示。

现场观众和体验师一起感受了声波随着折线沿y轴改变而产生的变化:图声波表示沿着X轴传播;在Y轴上较高的数据点的声音比在Y轴上较低的数据点的音调声音更高。

自诞生到现在的40多年,SAS和用户也都没有停止对数据分析的思考。除了业内用户,历届SAS 全球论坛都会邀请到一些全球各行业领袖代表,比如萨利机长、全球首个半机械人Neil Habisson,还有《赫芬顿邮报》创始人Arianna Huffington等。

今年,SAS邀请到了美国第一位女性F-14飞行员Carey Lohrenz、总统历史学家Jon Meacham、纽约时报畅销书作家Dan Heath。他们的演讲是论坛的“惊喜”,也引导听众们思考,数据分析在人文、历史和领导力建设中如何应用。


原文发布时间为:2018-04-16

本文作者:文摘菌

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
5月前
|
定位技术 网络安全 数据安全/隐私保护
部署Halo开源建站工具
Halo是一款强大易用的开源建站工具,拥有丰富的主题模板与插件,可以快速帮助您构建理想的网站。本文主要介绍使用Halo应用镜像快速部署Halo开源建站工具。
|
人工智能 Kubernetes 云计算
第五届CID大会成功举办,阿里云基础设施加速AI智能产业发展!
第五届中国云计算基础架构开发者大会(CID)于2024年10月19日在北京成功举办。大会汇聚了300多位现场参会者和超过3万名在线观众,30余位技术专家进行了精彩分享,涵盖高效部署大模型推理、Knative加速AI应用Serverless化、AMD平台PMU虚拟化技术实践、Kubernetes中全链路GPU高效管理等前沿话题。阿里云的讲师团队通过专业解读,为与会者带来了全新的视野和启发,推动了云计算技术的创新发展。
|
8月前
|
数据采集 存储 监控
Python 原生爬虫教程:网络爬虫的基本概念和认知
网络爬虫是一种自动抓取互联网信息的程序,广泛应用于搜索引擎、数据采集、新闻聚合和价格监控等领域。其工作流程包括 URL 调度、HTTP 请求、页面下载、解析、数据存储及新 URL 发现。Python 因其丰富的库(如 requests、BeautifulSoup、Scrapy)和简洁语法成为爬虫开发的首选语言。然而,在使用爬虫时需注意法律与道德问题,例如遵守 robots.txt 规则、控制请求频率以及合法使用数据,以确保爬虫技术健康有序发展。
1193 31
|
10月前
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
446 9
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
|
API
天气预报-腾讯天气-7天-地址查询版免费API接口
这是一个免费的腾讯天气API接口,用于查询指定地址的7天天气预报。支持POST和GET请求方式。请求参数包括id、key、province、city、county等。返回参数包含日期、天气状况、温度等信息。 示例请求地址:https://cn.apihz.cn/api/tianqi/tengxun.php?id=88888888&key=88888888&province=四川省&city=绵阳市&county=。
1039 7
|
移动开发 前端开发 JavaScript
做前端技术方案选型的时候,你是怎么做决策的?
做前端技术方案选型的时候,你是怎么做决策的?
307 0
|
运维 数据安全/隐私保护 网络协议
【网络建设与运维】2024年浙江省职业院校技能大赛中职组“网络建设与运维”赛项规程
【网络建设与运维】2024年浙江省职业院校技能大赛中职组“网络建设与运维”赛项规程
【网络建设与运维】2024年浙江省职业院校技能大赛中职组“网络建设与运维”赛项规程
|
iOS开发 MacOS Python
【Python】已解决:(Pycharm切换Python版本后报错)No Python at “C:\Program Files\Python39\python.exe”
【Python】已解决:(Pycharm切换Python版本后报错)No Python at “C:\Program Files\Python39\python.exe”
1314 0
【Python】已解决:(Pycharm切换Python版本后报错)No Python at “C:\Program Files\Python39\python.exe”
|
机器学习/深度学习 人工智能 自然语言处理
一站式AI服务平台:MaynorAI助您轻松驾驭人工智能
一站式AI服务平台:MaynorAI助您轻松驾驭人工智能
1018 0
|
SQL 存储 关系型数据库
【MySQL】DDL的表操作详解:创建&查询&修改&删除
【MySQL】DDL的表操作详解:创建&查询&修改&删除