你的位置:首页 > 数据库

[数据库]《大数据时代》简要笔记


 

一、大数据时代处理数据理念上的三大转变

  1、要全体不要抽样(不用随机的方法,而是采用所有的数据)

  2、要效率不要精确(接受数据的不精准和不完美,反而可以更好的进行预测,适用于精确度不要求那么极端的任务)

  3、要相关不要因果(不一定非要知道原因,只要知道结果)

二、面对新领域和新概念应有的态度

  1、努力在可以应用,可以扩展的地方应用它扩展它

  2、在不能应用的地方,就停下来

三、处理技术

  1、谷歌的MapReduce和开源的Hadoop平台

  2、数据不需要用传统的数据库表格来整齐的排列,如NoSQL

四、炒作周期 (技术成熟度曲线)(技术循环曲线)

  即经过媒体和学术会议大肆宣扬以后,新技术趋势一下跌至谷底,许多数据创业公司变得岌岌可危

五、字节

    太字节TB=240   拍字节PB=250 艾字节EB=260  泽字节ZB=270 

六、大数据时代最重要的技术,即个性化技术

  亚马逊为我们推荐想要的书,谷歌为互联网网站排序,LinkedIn猜出我们认识谁