水刑–分析比喻走得太远

点滴分析

像水一样,数据有多种形式。 人类的思想已经进化为可以过滤掉我们收到的大多数数据,因为其中有太多的数据。

当您睁开双眼,数据无处不在。 墙壁的颜色,空调的声音和邻居的咖啡味都被当作湿度来对待。 水一直在空气中,但要多加注意是没有用的。

当水凝结成雾时,它迫使您看到它,并使对周围世界的了解更加困难。 不完整的数据集,损坏的数据,糟糕的科学,错误的结论和认知偏见都使您迷失了方向。

数据像雨一样落下。 如果只有一点,那简直就是令人不满意–足以使您的汽车变脏并使对话混乱。 您会发现自己擦掉了眼镜上的斑点,这是因为有人从一些晦涩的源头收集了一些随机数据点。

  • 陈旧的水 在浅水池中是危险的。 从不可靠的供应中收集的数据,既不经过清洗也不经过标准化处理,并且变得停滞不前,很容易导致错误的结论。
  • A 稳定滴流 水仅够填满食堂或维持林地生态系统。 只有三个数据点(发送,打开,单击的电子邮件数)可以维持营销计划。
  • A 流量更健康 小溪形式的大量数据可用于沐浴。 连续的数据流允许进行基准测试和历史比较。 着陆页优化可以通过稳定的转化数据来完成。
    A 谦虚的河 可以驱动磨机锯木头或磨小麦。 推荐引擎只需要少数支流的可靠贡献就可以增加购物车的价值。
  • A 瀑布 可以推动巨大的水车,而充足的信息流入可以驱动实时的动态内容系统。
  • A 足够广泛和深入,可以支持整个运输行业。 来自广告网络,会员卡计划数据汇总器和数据代理的足够多的数据以cookie的形式漂浮在驳船和货船上。

当数据在预期的时间到达预期的数量时,可以对其进行捕获,传输和使用。 灌溉系统,水坝和水库提供了控制感,并允许建设具有运河,水闸和水坝的不断扩大的基础设施。 数据仓库建立在不那么值得信赖的流程上。

洁净仅次于圣洁

清洁水对于生活,灌溉,发电厂等的成功至关重要。“清洁”的定义可能因目的而改变。 如果水中有藻类可以冷却发电厂,这是可以的,如果饮用水中的砷含量超过十亿分之十,这是不可接受的。

数据是一样的。 在直接邮件应用程序中,您是否拥有某人的头衔(先生,太太,女士)是无关紧要的……除非您要邮寄给医生。 但是,肮脏的数据每次都会使您崩溃。

作为美国首席数据科学家, DJ Patil,将其放在第一轮CTO峰会上,“如果您从一开始就不考虑如何保持数据干净,那您肯定会感到困惑。 我保证事实发生后尝试清理至少需要几个月。”

如果将水加热到沸点,则可以推动整个工业革命。 数据似乎在做同样的事情。 从计算机可以存储和计算的那一刻起,数据的收集与创建存储设备的速度一样快。

数据湖

当这些支流的数据流经工厂的引擎时,它们全都流到了大坝后面的湖中。 由于数据以受控方式发布,因此为数据行业的涡轮机提供了动力。 诸如Google和Facebook之类的巨型数据处理引擎。 这里不会有干旱。

最后,还有一个深水潭,等待分析人员潜入水中。潜水员手握水枪和长矛枪,分析人员深入深处,绘制新地面并发现新物种。 成为数据浏览器非常激动人心。

这就是为什么其中许多人出现在 电子计量峰会 自2002年以来。下一个机会是在27年1月2015日至XNUMX月XNUMX日在波士顿举行。

eMetrics峰会注册

太远的桥梁

数据雕刻下一个大峡谷的力量是什么? 关于结构化数据的冰川融化呢? 在一个越来越关注隐私的世界中,我们如何处理废水?

这些是另一个时间的疑问,是桥下的积水。

你觉得呢?

本网站使用Akismet来减少垃圾邮件。 了解您的数据如何处理.