【数据科学家】公民数据科学家的时代已经到来

QQ群

视频号

微信

微信公众号

知识星球

Chinese, Simplified

软件工具使业务分析师能够在没有软件工程师和数据处理专家帮助的情况下生成分析模型和见解。

数据科学家的价值很高,这对 Google、Facebook、Amazon.com 和 Apple 以外的任何企业都构成了挑战。 有幸从大型科技公司挖走他们或从学术界挖来他们的首席信息官们在谈论他们将与他们的数据专家一起产生的所有商业洞察力时,都会自豪地微笑。

IBM 预计到 2020 年对数据科学家的需求将飙升 28%——这个数字可能是保守的。 为了解决人才短缺问题,公司正在构建软件来为公司完成繁重的工作,有效地从未嵌入 IT 的公司员工中培养“公民”数据科学家。

据研究公司 Gartner 称,公民数据科学包括允许用户在统计和分析领域以外的职位上从数据中提取预测性和规范性见解的能力和实践。 Gartner 分析师 Carlie Idoine 在一篇博文中表示,公民数据科学家是“高级用户”,例如没有计算机科学背景但可以执行简单到中等复杂的分析任务的业务分析师,而这些任务以前需要更多的专业知识。 她补充说,业务分析师等高级用户可以帮助缩小当前的技能差距。

Forrester Research 分析师布兰登·珀塞尔 (Brandon Purcell) 表示:“工具、技术、数据和模型的可用性不断提高,这使得洞察力能够传播给那些通常没有能力了解自己的人。”

数据科学为(几乎)所有人民主化


技术总能找到使信息访问民主化的方法。 那么改变了什么? 在大多数企业仍在采用的传统模型中,业务分析师与 IT 人员和数据科学家合作数月,以规划旨在生成预测洞察力的模型,而数据科学家通常从头开始构建模型。

现在,借助 IBM 的 SPSS 和 Alteryx 等工具,公民数据科学家(其中许多人没有或只有很少的编码经验)可以将数据模型拖放到某种软件画布上以获取见解。 Purcell 说,此类工具“使业务线分析师处理数据比在 Excel 中更容易”。

例如,通用汽车公司建立了 Maxis,这是一个分析平台,允许商业用户进行类似谷歌的查询,以获得销售预测和供应链绩效等运营指标的窗口。 专家们一致认为,通用汽车现在可能是一个异类,但很快就会有很多公司加入。

数据科学是石油巨头壳牌的一个关键重点,员工通过公司的 PB 数据来生成运营和业务洞察力。 壳牌数据科学卓越中心总经理 Daniel Jeavons 说,多亏了自助服务软件,以前可能无法利用分析的员工现在可以在没有技术帮助的情况下做到这一点。 例如,壳牌使用 Alteryx 的自助服务软件来帮助运行预测模型,预测数以千计的石油钻井机械零件何时可能发生故障。

“数据科学工具正在使低端数据科学大众化,因此或多或少任何人都可以做到,”Jeavons 说。 但另一方面,Shell 使用“强大的引擎”,例如 Google TensorFlow 和深度学习库 MXNet,以及 Python 和 R 编程语言。 “总会有一个跨越公民数据科学家和专业数据科学家的范围,我们必须支持两者。”

相反,公民数据科学家确实弥合了业务用户进行的自助式分析与归因于数据科学家的高级分析之间的差距。 Forrester 的 Purcell 表示,专业数据科学家在整个企业中构建和扩展数据模型和算法。

道明银行集团企业信息高级副总裁乔·多桑托斯 (Joe DosSantos) 说,由于现在广为接受的格言是数据是新石油,许多企业已经“被复杂分析的魅力所吸引”。 事实上,数据科学不再是关于巫师和神话中的独角兽。

DosSantos 说,TD Bank 使用范围广泛的基本到复杂的分析工具来更好地调整历史和当前客户数据,以及进行欺诈分析。 例如,该银行使用 AtScale 的软件来帮助业务用户从银行的 Hadoop 数据湖中查询实时数据并快速获得结果。 TD Bank 分析师在 Tableau 的自助可视化软件中查看数据。

数据科学家:仍然需要


其他软件供应商正在加速数据民主化趋势,通常采用机器学习 (ML) 和人工智能 (AI) 功能来构建自动化模型。

例如,Salesforce.com 提供 Einstein Prediction Builder,它允许业务分析师创建自定义 AI 模型,在任何自定义 Salesforce 字段或对象上添加变量以预测结果,例如客户流失的可能性或帐户的生命周期价值。 Adobe 的 Sensei 是另一种 ML 软件工具,可帮助营销人员在几分钟内启动营销活动,从而将任务缩短数小时。

Gartner 表示,到 2020 年,超过 40% 的数据科学任务可能会实现自动化。 “这种 [自动化 ML 方法] 是下一代数据科学,”Purcell 说。

当然,并非所有大数据挑战都能由公民数据科学家轻松解决。 公司仍然需要统计学家、数据科学家、精算师和其他精通高等数学技术的专家,德勤咨询公司认知和分析实践董事总经理比尔·罗伯茨 (Bill Roberts) 表示。 这些专家可以填补数据中的空白和缺失领域,而公民数据科学家不适合完成这些任务。

此外,罗伯茨指出,如果自助服务工具能够正常工作,可以很好地为企业服务,但如果不能正常工作怎么办? 如果出现问题并且数学不正确怎么办? 可能是算法本身有问题。 罗伯茨说:“当遇到困难或问题时,你需要受过一些培训或拥有更高学位的人来解决这个问题。”

本文地址
https://architect.pub/age-citizen-data-scientist-has-arrived
SEO Title
The age of the citizen data scientist has arrived