SAS:保持40年持续增长,创造了数据分析的商业神话

(上图为SAS公司联合创始人兼CEO Jim Goodnight)

有这样一家神奇的软件公司,从40年前创业伊始,就专注于创造数据分析的商用消费市场,为此开发了一整套软件平台以及230多种软件产品,把深奥数学原理广泛用于各类商业决策,让没有数学背景的人也能很容易用上数据分析。

这家叫做SAS的公司,最早起源于美国北卡罗来纳州立大学1966年的一项研究,即开发数据分析软件用于农业数据研究,那还是只有IBM大机的时代。40年后的今天,根据IDC的数据,SAS占全球高级和预测分析市场33.3%的份额,比前10名中其它9家相关厂商营收的总合还要多。

SAS公司创业40年来神奇地保持了持续增长,即使在2008年全球经济危机时期也没有裁员,2015年营收达到31.6亿美元。由于坚持不上市,SAS得以每年投入25%左右营收到研发中,SAS北卡总部保持着大学校园的风格,几乎每个员工都有自己的独立办公室!

2004年,SAS公司联合创始人兼CEO Jim Goodnight被哈佛大学评为美国最伟大的商业领袖之一,同年他被Inc.杂志评为全美25名最具魅力创业家。2011年,Forbes发表文章称Jim Goodnight为数据分析之王,当时SAS公司估值就超过了100亿美元。

2016年5月,记者走进SAS北卡总部,揭秘这家神奇公司背后的故事。


走在时代的最前沿

SAS公司起源于北卡罗纳州立大学在1966年到1971年间为农业数据研究而开发的一套方差与回归分析软件。1972年,该项目的主要参与者Jim Goodnight与后来加入者John Sall共同维持了软件的开发,并在1976年组建了SAS公司。

Jim Goodnight也毕业于北卡罗纳州立大学,先后获得了统计学硕士和博士学位。在读硕士期间,他对登月工程产生了深厚的兴趣,硕士毕业后凭借出色的编程能力到一家公司工作,该公司为与Apollo太空仓联络的地面站提供设备。Apollo太空仓项目后,他回到北卡罗纳州立大学完成了博士学位,随后就参与了农业数据研究项目。

虽然今天才迎来了大数据和数据分析的大风口,但早在40多年前,由于Goodnight出色的商业领导力、深厚的统计学功底以及出色的编程能力,就已经开创了数据分析的商业传奇。如今,SAS公司在59个国家和地区拥有超过1.4万名员工,在全球149个国家分布着超过80,000家客户,客户包括2015年《财富》全球500强名单前100家公司中的91%。

SAS:保持40年持续增长,创造了数据分析的商业神话

(上图为SAS公司执行副总裁兼首席市场营销官Randy Guard)

“数据管理、数据分析和数据消费,这是SAS一直专注的领域。”SAS公司执行副总裁兼首席市场营销官Randy Guard如是说。SAS目前的230余种产品从技术逻辑上主要分为五大类:底层的SAS Foundation,提供了诸如分布式数据管理、跨多数库源访问、数据可视化、数据挖掘和高级分析建模等核心数据处理功能;SAS分析服务器层,包括了OLAP服务器、存储过程服务器等数据服务器功能;SAS基础服务层,提供了基于Java的中间件;SAS应用服务层,为客户端提供面向业务的查询和报表服务;SAS客户端服务则是一套基于Web的桌面界面。

目前SAS商用套件版本已经更新到9.4,另外还推出了面向不同技术需求的独立软件,以及一整套技术开发环境。在垂直行业方面,SAS从90年代开始就针对医药、金融、制造、电信以及人力资源管理等行业推出了应用解决方案,在每个行业还有更多细分产品,例如SAS银行业解决方案就包括营销与客户体验、风险与合规、欺诈与金融犯罪、分析、数据管理等20余种细分方案。

2016年SAS最新发布了面向云端和本地通用部署的平台Viya,以跟进企业用户IT系统的演进。SAS首席技术官及研发部门负责人Armistead Sapp说,Viya就是集合了过去40年经验的新版本SAS,所有的数学模型都与之前一致,但计算方式则演变成了云计算的模式。

历经了40年的积累,SAS始终走在时代的最前沿。今天的SAS有着其它新创数据分析公司无可比拟的优势,就是过去40年从全球企业用户的数据分析中吸取的实践经验和算法。


1亿美元产品俱乐部

在SAS北卡总部的研发大楼里,有一个1亿美元产品俱乐部纪念碑。在这个纪念碑上记录着50余种创造了超过1亿美元营收的产品名录,这些是SAS公司的数学家、数据科学家和软件工程师们共同创造的软件产品,它们让普通人很容易掌握数据分析思想、工具和解决方案。

SAS:保持40年持续增长,创造了数据分析的商业神话

(上图为SAS的1亿美元产品俱乐部)

Armistead告诉记者,SAS在选择产品开发方向的时候,要判断潜在市场体量、能否成为新市场的领导者以及现有客户对新产品的期待程度,于是就有了客户洞察、风险管理、欺诈及安全智能、绩效管理、供应链管理等面向特定应用场景的产品以及金融、零售、制造、教育等行业解决方案。

SAS的研发管理是产品经理导向,产品经理要经常与客户交流从而不断了解新的用户需求,还要与各种分析师沟通以了解竞争对手动向以及整体市场对产品功能的需求。产品开发经理把这些可行的潜在用户需求带回研发团队,与现有的产品对比后,再做产品开发的决策。

在SAS公司的1亿美元产品俱乐部中,既包括了平台型软件产品,也包括了面向垂直行业的解决方案,还有针对微软Office平台的分析产品以及为苹果开发的软件产品JMP。在过去的40年间,SAS软件历了从大型机到PC的演进,支持所有主流操作系统和计算架构。

1亿美元产品背后还有SAS强大的专业能力。SAS既为专业用户提供了SAS开发语言,也有Enterprise Guide这样的图形化界面让普通用户通过鼠标点击拖拽就能完成数据分析工作。SAS软件涵盖了统计学、运筹学、计量经济学与预测等全面的应用数学领域,提供了所有的实用数理统计分析方法以及机器学习和人工智能等高级算法,而且还在不断吸收新的算法。

从15年前开始,SAS就开始了神经元网络算法软件的研究,2002年推出了文本挖掘产品Text Miner。近3年来,SAS也在着手深度学习算法研究,特别是近期的无监督学习算法。“这些是未来的重要趋势。”Armistead说。


研发:不是秘密的秘密

SAS现有3500名研发人员,其中约350名位于北京研发中心,400-450名位于印度研发中心,约2000名研发人员位于北卡总部的三位研发大楼里。对于这样一个庞大研发团队的管理,SAS把研发人员分成了约192个研发小组,每组平均18人,最多有77人、最少有6人。

SAS:保持40年持续增长,创造了数据分析的商业神话

(上图为SAS公司首席技术官及研发部门负责人Armistead Sapp)

Armistead保持每年与这192个研发小组至少两次面对面的机会,用于了解每个研发小组的年度进展以及解决所遇到的问题。SAS对每个研发小组仅设置宽泛的KPI指标,每个研发小组都有自己需要负责的产品,而小组内部的研发人员则有自由度来尝试新的想法。

SAS鼓励面向创新的“快速失败”方法论,即研发人员可以不断发起各种新的尝试,只是需要快速创新、快速失败、快速开始下一个尝试。比如,现在SAS就有研发人员尝试在平板、电脑和手机等设备之间的无缝用户体验,也有研发人员尝试用Go和Swift语言写SAS软件。

在研发方法论方面,当前SAS主要采用敏捷开发方式,以30天为一个迭代周期,一个产品开发周期最长能达12个迭代周期、最短为6个迭代周期,平均为9个迭代周期。SAS差不多从10年前开始采用敏捷开发模式,之前一直为传统的瀑布流开发模式。

随着现代计算架构进入到云计算时代,SAS也开始采用DevOps边开发边运维的模式。DevOps把在线软件的迭代周期推进到周甚至到以天为单位,软件的交付通过互联网自动化的部署而无须人工干预。

SAS最新推出的Customer Intelligence 360就是第一款基于DevOps开发模式的软件产品,目前包括SAS 360 数据探索(SAS 360 Discover)和SAS 360 互动营销(SAS 360 Engage)两个核心模块,2016年内将推出更多模块和功能。

在SAS总部工作了18年的技术专家魏继法表示,企业非常注重数据安全和数据隐私,为此SAS在2006年左右开发了Model Manager分析模型管理工具,一方面便于管理用户的分析模型库,另一方面可把已有分析模型部署到企业数据库里,而不需要企业把自己的数据导入SAS。

Armistead说,40年来SAS的成功秘诀在于听取客户声音,以及为企业级用户提供可扩展的数据分析解决方案,从而能适应大型企业的分布式计算环境和需求。


紧跟计算架构的演进

在SAS工作了14年的Oliver Schabenberger从2009年开始负责Analytical Server,这是当时对于多核分布式高性能计算架构的响应,Oliver现为SAS研发副总裁。之前的SAS软件是单机单线程计算,Analytical Server从数据管理和计算层进行了隔离,可在单机24线程、多机群的分布式环境中,完成海量数据分析的任务。

SAS:保持40年持续增长,创造了数据分析的商业神话

(上图为SAS公司研发副总裁Oliver Schabenberger)

对于SAS用户来说,前端可以使用任何终端设备,包括网页、瘦客户端、笔记本、平板电脑、手机等,后端就是Analytic Server处理海量数据计算与分析,这也是SAS对于后来的云计算、大规模并行计算、分布式数据分析等的解决方案。采用了独特算法的Analytical Server可以把大数据当成“小数据”来处理,这对于物联网和可视化分析来说非常重要。

Oliver表示,SAS并没采用Hadoop等现成的分布式计算开源软件,而是自行开发了分布式并行计算架构,并加入了内存计算等技术。而这些技术的研发,也都是在客户需求下促成的。比如金融机构需要分析成千上万支股票的风险水平,这就是海量数据的计算任务,并且要在很快的时间内完成,否则对于金融机构来说就没有实际的意义。

有了Analytical Server,SAS软件可以不用提前预知每一次数据分析的意图,而是在数据流动过程中快速完成数据分析,这就使得探索型数据分析成为可能。特别是Analytical Server能管理海量并行内存,这种并行式内存计算可实现实时探索型数据分析,尤其适用于物联网。

在物联网环境中,数据流动在前端移动设备上以及后端的服务器里。对于SAS来说,在前端有ESP(Event Stream Processing)解决方案处理实时流数据,在后端有Analytical Server处理海量并行计算。作为独立产品的ESP,现在也被直接内嵌到Viya云服务架构中。

负责物联网解决方案的SAS产品管理总监Jason Mann表示,ESP是SAS在过去的18到20个月内自主研发出来的流数据处理产品,其产品核心竞争力在于数据处理的能力以及模型的稳定性,可实现高速、小时间窗口及大规模的流数据处理,支付多种开源语言和多种数据源。

Oliver表示,SAS正在把数据分析和计算推向前端,更多也在流数据中完成数据分析和处理,而不是等数据回到后端数据中心才处理。现在智能手机的计算能力越来越强,可完成很多计算任务。数据流动是计算性能的首要杀手,因此要把计算能力推向数据。Jason Mann说,物联网其实就是计算架构向边缘计算的演进,把决策、分析和洞察推进到了设备端。


数据分析是一种信仰

作为在全球范围内最早创造和推出商用数据分析产品和解决方案的公司,SAS还有一个非常重要的工作,那就是市场教育。数据分析并不能直接创造商业价值,而且分析结果有的时候甚至与直观经验相反。对于企业来说,投资数据分析,就是投资一种商业理念甚至是商业信仰。

SAS:保持40年持续增长,创造了数据分析的商业神话

(上图为SAS公司首席客户官Fritz Lehman)

32年前Fritz Lehman刚加入SAS公司,那个时候他年仅25岁,刚从学校毕业没有多久。刚加入SAS公司时,Fritz主要帮助客户解决使用SAS税务报表产品问题,在那之后的很长时间都负责客户关系管理。2015年12月,Fritz成为首席客户官,这也是SAS首次设立这个岗位。

在过去25年,Fritz看到太多的企业不相信数据分析的结果。比如零售行业客户采用SAS解决方案试图预测季节性销售的价格和产品,其中有一个零售商并不相信SAS的分析结果,因为他们已经做了40多年类似工作,认为自己了解一切,而SAS分析结果却提供了新观点。

“大公司不太容易接受数据分析及其结论,小公司就容易得多。最近10年诞生的技术公司,都是从诞生第一天开始就基于数据和数据分析,因此它们是数据分析的信仰者。但有了数据分析信仰并不能一定确保成功,还需要有一个好的商业模式。”Fritz说。

尽管Fritz是学教育专业出身,但他母亲和姐姐都是数学分析专业的博士,加上32年的SAS职业生涯,不仅他自己也成为了数据分析专家,更重要是培养了数据学析的信仰。