活在当今的这个时代,我们有幸亲眼见证了整个世界的飞速发展和变化。进入互联网时代,一切的发展都开始快得让人几乎跟不上脚步,几年前还很热门的互联网+,转眼已经被“大数据”替代。
在过去的十年里,我们所创造的数据量,已超过人类历史的数据总量。每当我们打电话,发信息,搜索,旅行,购物,做任何的事情,我们都在创造新的数据,数据将成为我们的世界里最强大的一种力量。
虽然大数据是个香饽饽,但是并不是所有人都理解大数据到底是什么,对于它能做什么也是只有一些模糊的想法。很多时候,人们误以为的大数据,其实只是数据量相对多,并不是真正意义上的大数据。
能够称之为大数据的,至少是以“亿”为单位的体量,而且是不可能用传统的数据库和软件来处理的,需要新的处理模式才能发挥大数据的作用。
其实,数据本身是没价值的。打个比方,菜市场卖的白菜萝卜价值不高,只有把白菜萝卜做成满汉全席,价值才会体现出来。可是如果没有白菜萝卜,那么满汉全席也没戏。大数据的价值在于我们能够使用独特的方式去解读它,用适合的模型来应用它,把它变成能够为我们所用的工具。
大数据的关键,在于你能否问出正确的问题,建立正确的模型。只有模型对了,大数据才能焕发生命力。
15年前阿汤哥演的电影《少数派报告》里,就有非常超前的大数据的概念。电影中阿汤哥任职的犯罪防治局Precrime,就是通过先知预测犯罪的发生,阿汤哥就能在犯罪实施前把犯人抓获,避免悲剧的发生。
现实生活中没有神通广大的先知,那我们该怎么办呢?
洛杉矶警察局和加州大学的合作给大家做了一个很好的示范。
通过研究加州过去八十多年的历史犯罪数据,人类学教授Jeff Brantingham从中发现了许多规律,许多犯罪是重复发生的。通过对数据的研究,他们能够找出犯罪率高的地区,但这只能记录过去,并不能代表未来。要实现电影中的场景,除了海量的数据,他们还需要一个关键的帮手--一个模型。
于是他们找到了数据家George Mohler.George发现,每当一个案件发生后,不久之后在附近就会有新的案件发生,这让他想到了预测地震的模型。一般来说,首次地震我们很难预估,但是地震之后紧接着会有余震,这些余震发生的强度和地点是可以通过一系列的算法和方程式来预测的。如果犯罪真的像地震一样,会有余震的效应,那么把这个模型运用到警察的日常工作中,就能够预测犯罪的发生。于是他们把预测余震的方程,修改成了预测犯罪的方程。当他们将历史犯罪数据导入方程中,得出的预测,符合了已有的犯罪数据。于是洛杉矶的警察开始根据他们提供的每日犯罪预告来进行巡逻,对于预测标出的高危地区,他们会增加巡逻的时间和频次。运行一段时间后,这个方程促使当地的财产犯罪下降了12%,入室行窃下降了26%.
证实了这个系统有用以后,它成为了警察叔叔们日常工作的一部分,并且推广到了全美超过150个城市。
中国也在利用大数据实现对罪犯的抓捕,通过现在广大布局的监控录像网络和人脸识别系统,不管犯罪分子逃到天涯海角,都逃不出法网的制裁。这才是真正意义上的“天网恢恢疏而不漏”.
给大数据一个正确的模型,它不仅能够改变警察的工作方式,也能改变人们的生活。
一个好的模型对生意是至关重要的。它不仅能使得你的生意从同类之中脱颖而出,同时还能延续它的生命周期,活得比别人久。
上海最近又多了一个网红打卡点,就是新开的星巴克 Reserve Roastery.一开业就已经大排长龙,没有在里面拍过照发过定位都不好意思说自己都在时髦的尖端了。
说到卖咖啡,全世界应该没有别人卖得过星巴克。咖啡店那么多,味道不是最好喝的星巴克为什么独占鳌头呢?
因为星巴克根本不是卖咖啡的,它卖的是一种介于家和办公室之外的“第三空间”,是从家到公司的转换站。
Howard Schultz 在收购星巴克后,把自己在意大利的见闻放进了星巴克,将它从一个卖咖啡豆的公司打造成了今日的咖啡帝国。
在意大利,他总能看到人们坐在路边的咖啡馆里,看书,聊天,或者谈事情,在咖啡馆里打发时间似乎是一件非常重要的事情。以这个为灵感,他改变星巴克的生意模式,着重营造独特的“星巴克体验”,让全球各地的星巴克店成为人们除了工作场所和生活居所之外温馨舒适的“第三生活空间”.
正是这个模型,让星巴克在咖啡产业独放异彩。
其实建模不一定需要大数据。如果有大数据来论证,效果会更好,但关键永远是模型而不是数据。
要找到正确的模型,需要问正确的问题。就像星巴克,Howard问的问题不是如何做出更好的咖啡,而是如何让“去星巴克喝一杯咖啡”成为人们生活的一部分。问对了问题,就找对了方向。
《少数派报告》里还有一个很牛逼的场景,就是定向推广,根据每个人的不同情况,推送定制化的广告。
如果能够在消费者意识到自己要买什么之前,就给他们提示,对于商家来说简直就是开外挂一般的存在。但是要如何知道消费者想要什么呢?这就需要大量的数据来研究每个人的消费习惯和需求,然而在这一点上,目前最有资源做这件事的某宝,emmmmmm……做的不怎么样。
可见如果光靠大数据,并不能解决问题。
大数据不像传说中说的这么神奇。不然的话,拍电影和写小说直接用大数据和人工智能不就行了吗。早前让剧粉大呼过瘾的美剧纸牌屋号称是靠大数据来编剧的,但《纸牌屋》的编剧John Mankiewicz对此进行了否认。“一部电视剧的走红,关乎导演、演员,更关乎有创意有深度的故事与讲述故事的手法,但市场本身充满了偶然性,并非数据能够算出。”但无疑,《纸牌屋》成功地蹭到了大数据热度。
去年让全球人民一起吃瓜的美国竞选,所有的民调数据显示都是希拉里会赢,但结果就是让大家啪啪打脸,如果大数据奇准无比的话,预测结果就应该反过来。但是有一个地方,在中国,早早地预测了大选的结果。
这也让义乌这个小商品集散中心大放异彩,现在,“义乌指数”也成为了很多行业的重要参考和风向标~
《连线》(Wired)杂志创始主编、《失控》作者Kevin Kelly曾经对大数据提出过自己的看法:“现在所在的数据世界,数据本身是没价值的,它怎么样才能有价值呢?是数据和数据连在一起,和业务连在一起才会有价值。”他也说过:“好的问题会得到一个答案,一个更好的问题会引出更好的其他问题。这对于创新是必不可少的,是创新的来源。如果需要好的答案去问机器就可以了,但是如果要一个好的问题,那一定要找人来提这个问题。”
大数据的时代已经来临,数据正在改变我们的世界。数据的海洋如此广阔,你想要得到答案,就需要你向它问问题。
学会问问题,培养自己问问题和找模型的能力,才能在时代的变迁中保持竞争力,才能活得比别人久,活得比别人好。
更多大数据相关资讯,请扫描下方二维码