也许最大的和最知名的大数据失败案例是在谷歌公司的2013年流感趋势。谷歌于2008推出这项服务,目的是预测25个国家的流感疫情。逻辑很简单:在特定区域分析谷歌关于流感的搜索查询。下一步是将搜索结果与该地区流感活动的历史记录进行比较。基于这些结果,活动水平被分为低,中,高或极端。
尽管乍一看,这似乎是一个很酷的想法,但实际上并不是这样。在2013年流感高峰期,谷歌预测的流感的趋势悲惨地失败了。事实上,这个数字是惊人的140%.原因是算法有缺陷,没有考虑到几个因素。例如,如果人们搜索“冷”或“发烧”这样的词,这并不一定意味着他们正在寻找流感样症状。他们可能一直在寻找季节性的疾病。对于谷歌流感趋势不幸的是,它无法从这场灾难中恢复过来,最终导致了2013年的崩溃。
大数据失败的原因
谷歌流感趋势的失败并不是唯一的灾难。人们不可能列出这些年来所有大数据的错误,然而,分析失败是很重要的,因为可以吸取教训,不要在功能上重复错误。大数据失败的一些原因如下:
(1)缺乏数据管理和数据管理
组织往往不完全了解他们已有的数据,但他们仍然决定在此基础上开展新的项目。缺乏关于数据处理的文档、存储、策略和其他程序。采用大数据咨询公司的服务是一个好主意,这样企业就可以为自己提供一个清晰的路线图和指导,说明如何处理已经拥有的数据,然后才能克服大数据的挑战。
(2)未定目标和战略
这里有很多IT术语和营销术语,而且在白噪声中难以理解。此外,市场上还有很多大数据产品,选择合适的产品真的很困难。企业在决定任何事情之前,找出实现目标所需的服务和技术非常重要。“做大数据的小数据”,这意味着企业应该在少量数据上评估其大数据架构,以确保选择正确的产品。
(3)完全不了解
数据科学和大数据是领域知识,数学,统计专业知识和编程技能的复杂组合。然而,同时它也必须具有商业意义。通常,IT部门会做出管理层不能理解的变更,反之亦然。为了确保企业了解大数据行为对IT和业务领导者都有意义,应该在大数据项目中构建IT与业务之间的桥梁。业务人员应该深入参与大数据项目的任何阶段。
(4)项目太大太快
当企业第一次开始实施大数据项目时,有很多未定义的因素,比如预算、技术、行动方式等等。当企业很早就开展一个大项目时,那么注定要失败。相反,应该选择一个小项目进行,并衡量成功(或缺乏)增量。这样如果出现问题,将能够立即注意到它,并在项目结束之前进行必要的调整。衡量企业的进步的好方法是创建概念的原型或证明来验证其所完成的工作。如果项目早期存在缺陷,推进项目的下一阶段就没有意义了。
(5)缺乏IT人才
企业找到和雇用所需要的人才来成功完成一个项目是一项艰巨的任务,但处理企业数据的工作人员是整个项目的重要组成部分。而且,他们必须精通新技术,这对于快节奏的IT环境来说是一个挑战。
从上面的列表中,人们注意到的一个共同的主题是,无论想要关注数据多少,人们总是受到阻碍。即使人们想要数据来决定决策过程,人们最终还是要管理大数据流程。这包括做出基本决定,例如收集和保存哪些数据,以及从大数据中寻找哪些答案。
更多大数据相关资讯,请扫描下方二维码