02 大数据应用发展史: 从搜索引擎到人工智能
大数据应用的搜索引擎时代
1 | Google公认的大数据鼻祖,存储着全世界大量的网页,大约需要数万块磁盘---->GFS,将数千台服务器上的数万块磁盘统一管理起来,然后当作一个文件系统,统一存储所有这些网页文件。---->构建搜索引擎,需要对这数万块磁盘上的文件中的单词进行词频统计,然后根据PageRank算法计算网页排名。这中间Google需要对磁盘上的文件进行计算处理---->MapReduce大数据计算框架应运而生 |
1 | Google之前,世界闻名的搜索引擎是yahoo。Google凭借自己的大数据技术和pagerank算法,使搜索引擎体验得到质的飞跃,yahoo没落。 |
1 | Doug cutting率先根据论文做了Hadoop。yahoo挖Doug Cutting---->Doug Cutting跳槽到专职做Hadoop的商业化公司Cloudera. |
大数据应用的数据仓库时代
1 | 当Facebook推出Hive的时候,嗅觉敏感的科技公司都不淡定了,他们开始意识到,大数据的时代真正开启了。 |
大数据应用的数据挖掘时代
1 | 大数据一旦进入更多的企业,我们就会对大数据提出更多期望,除了数据统计,我们还希望发掘出更多数据的价值,大数据随之进入数据挖掘时代 |
大数据应用的机器学习时代
1 | 我们很早就发现,数据中蕴藏着规律,这个规律是所有数据都遵循的,过去发生的事情遵循这个规律,将来要发生的事情也遵循这个规律。一旦找到了这个规律,对于正在发生的事情,就可以按照这个规律进行预测。 |
1 | 大数据从搜索引擎到机器学习,发展思路其实是一脉相承的,就是想发现数据中的规律并为我们所用。所以很多人把数据称作金矿,大数据应用就是从这座蕴含知识宝藏的金矿中发掘中有商业价值的真金白银出来。 |
1 | 数据中蕴藏着价值已经是众所周知的事情了,那么如何从这些庞大的数据中发掘出我们想要的知识价值,这正是大数据技术目前正在解决的事情,包括大数据存储与计算,也包括大数据分析、挖掘、机器学习等应用。 |
1 | 我们不曾生活在美国西部淘金的繁荣时代,错过了那个光荣与梦想、自由与激情的个人英雄主义时代。但是现在,一个更具划时代意义的大数据淘金时代已经到来,而你我正身处其中 |
1 | 统计人的驾驶行为进行机器学习,就是无人驾驶;统计股票的历史交易数据进行机器学习,就得到量化交易系统。统计大家p图的参数进行智能美颜。统计过去在网上的商品浏览进行机器学习,就有了亚马逊的智能推荐物品;蚂蚁金服上统计过去的消费能力和信贷进行机器学习,来预测可在借呗上借多少钱,这是一个大数据和机器智能的时代,我们身处其中,需要的是适应并不断学习前行才不会在一段接一段的浪潮中被退去。推荐系统、广告系统、估价系统、风控系统都是现在广泛使用了机器学习的。微软识花 |