【数据应用】用于分析的数据应用程序
视频号
微信公众号
知识星球
新一代工具弥补了技术用户和非技术用户之间的差距
2021年,“现代数据堆栈”成为全城的热门话题。正如Tristan Handy去年预测的那样,数据工具正在发生“寒武纪大爆炸”。随着公司和开源项目争相填补空白,见解的开发和交付方式正在重塑。在所有新来者中,有一件事越来越清楚:灵活性为王。仪表板和点击式BI工具在其不灵活的荣耀中,越来越不足以满足数据分析师和消费者的需求。
新一代构建数据应用程序的工具将取代它们,提供类似仪表板的易用性,在后端和前端都具有更大的灵活性。
现状怎么了?
2021年,随着数据堆栈的其余部分以惊人的速度成熟,老式的仪表板不再足以作为数据分析的标准输出。
对于数据分析师来说,它们往往不够,被迫将他们的工作融入一系列缺乏上下文的瓦片中。对于数据科学家来说,它们几乎总是不够的,无法轻松地将建模结果反馈到点击式仪表板工具中。即使对于专业的仪表板构建者来说,它们也可能不够,他们注定要永远尝试从一个充满方形瓷砖和不灵活过滤器的页面中“构思叙事”。
BI工具尽管功能强大,但也有严格的局限性。用户可以轻松读取数据,但用户友好的界面是一把双刃剑,阻碍了报告的灵活性和交互性。它们通常也仅限于基于SQL的分析,从而关闭了数据团队用其他语言完成的大量工作的大门。
仪表板的主要症结在于,通常情况下,它们对仪表板的消费者来说已经足够了——或者至少比可用的替代品更足够了。对于需要对数据采取行动的利益相关者来说,仪表板布局标准,非常易于使用,最重要的是,加载和读取无需任何技术开销。
这与Jupyter Notebook形成了鲜明对比,后者非常适合更复杂的数据分析,但实际上无法与非技术利益相关者共享。提供数据分析的无数其他聪明方法也是如此:你可以构建令人惊叹的东西,但它们没有用处,因为没有人能使用它们。每个人都可以点击一个链接打开一个简单的仪表板。
但每个人也可以使用Excel电子表格、谷歌文档、Powerpoint和PDF。BI工具仪表板作为丰富分析工具的不足并不能阻止这种分析的发生——它只是在大多数组织中创建了一个临时数据工作的“黑市”。亲爱的读者,看着你的网络摄像头,大声发誓你从未发送或接收过ModelOutput final(1).csv,从未从Jupyter笔记本上截取过屏幕截图复制到幻灯片中,也从未从BI工具下载过报告并在Excel中打开,这样你就可以调整它不允许你做的一件事。
我是这么想的。
这就是仅仅依赖仪表板作为数据世界的标准输出的真正问题。这不仅是因为它们本身不足以作为复杂数据分析的工具。这是因为它们的缺点引发了一个混乱的黑社会,其中包含了更糟糕的数据产品,这些产品往往是静态的和过时的。
数据应用程序
那么,还有什么更好的方法呢?事实上,它并没有那么具有开创性。等式中分析方面的每个人都希望有更多的灵活性,消费方面的每一个人都希望简单——尽管不能以牺牲交互性为代价。双方都同意这样一个事实,即未经批准的松散文件如龙卷风般飞来飞去,令人困惑。
“数据应用程序”是各种不同数据产品的总称,这些产品既可以进行丰富的分析,也可以进行简单的演示。数据应用程序可能看起来非常多样化——一个简单的点击式仪表板、一个带有实时图表的故事式文档、一个双按钮转换工具——但它们总是提供简单简洁的输出,掩盖了非常灵活的分析后端。与网站一样,数据应用程序可以独立存在,并且可以轻松地与广泛的受众共享。
Excel电子表格实际上是(初级)数据应用程序的一个很好的例子!技术先进的分析师可以获得丰富的灵活性和复杂性,但最终用户会看到一个极其简单但交互式的界面。也许Excel不是最前沿的例子,但它突出了可以被视为数据应用程序的各种可能性。
一些大型组织通过构建定制的数据应用程序,通过自己的工程团队创建的本土基础设施和框架,解决了这一问题。虽然这些一次性数据应用程序可以定制以满足任何需求,但开发和维护它们的开销非常高。这种方法对99%的团队来说是不值得的。
数据团队不需要访问一大群等待将笔记本电脑变成成熟的网络应用程序的网络开发人员。他们当然不需要自己学习React来将这种能力引入内部。数据团队只需要一个框架来进行分析并自己共享;最有效的解决方案是在数据应用程序工具空间,而不是在手工的一次性web应用程序中。
街区里的新生
这一领域出现了新一代工具,使数据团队能够为其组织的其他部门快速构建数据应用程序。除了允许分析师创建更灵活的数据接口外,这些工具还将分析和输出紧密结合在一起,而不会在多个工具之间产生碎片。这意味着数据从业者可以使用他们想要的任何语言和框架,而无需通过屏幕截图或导出来将他们的工作与现实分离。
Shiny多年来一直帮助R用户做到这一点,允许在不编写一行非R代码的情况下构建交互式应用程序。Streamlight和Dash让用户在不离开Python的情况下做同样的事情,Python已经成为数据世界中最流行的脚本语言。Hex采用了一种混合方法,让用户用Python和SQL进行分析,然后使用drag-n-drop应用程序生成器来构建数据应用程序。
所有这些工具旨在弥合技术数据从业者和技术含量较低的数据消费者之间的共享差距,而无需任何一方做出牺牲。这就是数据应用程序的前景——丰富的分析、易于共享和消耗的输出、低开销。
数据(应用程序)驱动的未来
数据从业者应该继续使用他们熟悉的任何语言和框架,而不必在与利益相关者共享结果时求助于一次性导出、孤立的屏幕截图或不灵活的BI工具。
数据消费者应该能够方便地访问操作上有用的交互式数据产品。他们永远不需要在一个输入发生更改的情况下向数据团队请求新的csv转储。他们也不应该通过同样疲惫的报纸仪表板布局来消费每一份报告!
标准仪表板值得一试!几十年来,我们一直在努力满足每个人对一份好的数据报告的期望。他们可以休息一下,重新开始做他们擅长的基本顶级BI报告(呵呵)。他们当然赢得了这一点。
松散的csv文件和陈旧的幻灯片组值得……不管发生什么。对糟糕的数据毫不留情。
随着现代数据堆栈的不断扩展,数据团队在进行和共享分析方面将比以往任何时候都有更多的选择。数据应用程序和构建它们的工具的兴起将使数据分析保持协作性、交互式,最重要的是:实际上是有用的。
- 5 次浏览