大數據類的讀書筆記
讀書筆記是讀書的時候經常做的筆記,下面就讓我們來看看大數據類的讀書筆記!歡迎閱讀!
大數據類的讀書筆記
未來的十年,將是大數據引領下的智慧科技時代。不管你是否意識到它的存在,大數據都將越來越快地改變我們這個時代,包括我們的生活方式。
維克托·邁爾-舍恩伯格是最早洞見大數據時代發展趨勢的數據科學家之一。他通過一個大家熟知的事例,來幫助我們理解“大數據”的潛在影響力,那就是四個世紀之前望遠鏡和顯微鏡的發明。望遠鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,它們都是收集海量數據的新工具,因為這種工具的發明,人們同步更新了分析數據的技術和方法,促進了人們對世界更好的理解。如果說望遠鏡和顯微鏡是測量領域中的一場革命,那么今天的數據測量就相當于是現代版的望遠鏡、顯微鏡。隨著社交網絡的逐漸成熟,移動帶寬迅速提升,云計算、物聯網應用更加豐富,以及更多的傳感設備、移動終端接入到網絡,由此產生的數據及數據的增長速度比歷史上的任何時期都要多、都要快。一個大數據的時代,不經意間順理成章地翩然而至。
一、什么是大數據?
大數據是當前最熱門的話題之一。但什么是大數據,人們尚未給出確切的定義。首先,“大數據”是相對過去小的、局部性的數據而言的;其次,利用大數據進行分析和工作時,所依據的關于此事盡可能完整的數據,從而“一覽眾山小”,而不是采用局部的小數據,從局部推斷整體。
維克托也并未直接給出大數據的定義。不過,他用三大轉變描述了大數據的特性:
轉變之一:在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴于隨機采樣。例如一項針對相撲比賽中非法操縱比賽結果的研究對64000場比賽進行了分析,這算不上一個很大的數字,但由于這是過去十年所有的比賽,所以它是大數據。
轉變之二:由于有了更多的數據,我們可以接受更多的混雜、更多數據上的不精確。如果我們對于一個事物只有50個數據點,那么每一個數據點都必須非常精確,因為每個數據點都是有用的;但是如果我們有5000萬個,去掉10個,甚至去掉1000個都沒有太大的問題。
轉變之三:不再探求難以捉摸的因果關系,轉而關注事物的相關關系。分析大數據主要為了預測未來“是什么”,而不是“為什么”。因為很多時候我們以為我們找到了事情背后的原因,實際上卻沒有找到。更多時候知道了“是什么”就足夠了。例如知道流感將會擴散到哪里就足夠了,我不需要知道為什么;知道什么時候在網上購買機票能夠獲得最優惠的價格就足夠了,我不需要知道為什么此時價格最低。
二、大數據帶來的變化
大數據從根本上改變我們認識世界和改變世界的方式。很多傳統的習慣將被顛覆,很多舊的制度將面臨挑戰。舉例來說:
第一,科學探究的思路和方式受到挑戰
探究是新課程改革中的一個熱詞,是促進學校教學與科學研究相融合的實踐舉措。科學探究的基本路徑是:發現問題,提出假設,制定方案,實踐探究,分析數據,得出結論。之所以會梳理出這樣一個探究的路徑,與我們對問題知曉的信息過少有關。換句話說,對所要研究的事物,我們知道的數據很少,需要從這些很小的數據出發,通過猜想和假設,進行試探性的研究,如果研究得出的結果和自己的假想是一致的,則說明我們的假說是正確的,這些假說會上升為對該事物描述的知識,我們掌握該事物的數據也隨之增加。
利用測量所獲得的點滴數據,從一個局部來推測世界是怎樣的,這是科學探究的基本思路和方式。長期以來,我們總是通過這樣的方式來認識世界,對其有宗教般的信仰。盡管我們知道,決策者總是先有了想法,才會提出假設。如果決策者自身對所研究的事情存在著偏見,所提出的假設就很難得到實證的支持,這往往會導致探究花費了很長的時間、很大的物力和財力,也常常勞而無功。但科學研究者還是堅定不移地沿著這條道路前行,學校在教學中也將其作為科學研究的基本規范來傳授。
在大數據時代,這樣的研究方式收到了極大的挑戰。先舉個事例來說吧。手機輻射是否能夠致癌?關于這個問題,無論我們的假設如何,實驗的設計都很難進行。首先,樣本選擇過少,沒有統計學上的意義;其次,不能拿人做研究對象;第三,短時間的研究很難觀察到變化。有了大數據之后,這樣的難題就可以迎刃而解了。前段時間,丹麥就進行了這樣的研究。丹麥擁有1985年手機推出以來所有手機用戶的數據庫。他們從這個數據庫中分析了1990年至2007年擁有手機的所用用戶的數據,同時,他們還收集了這一期間醫院收集的所有癌癥患者的數據,然后分析手機用戶是否比非手機用戶有更高的癌癥發病率。這兩個數據庫本身是完全獨立的,在作分析之前從來沒有想過可以做這樣的研究。結果表明,使用移動用戶和癌癥風險增加之間不存在任何關系。2011年10月,這一研究的結果發表在《英國醫學雜志》上。
上述的案例告訴我們,在獲得了大量的數據,能夠對事物的整體進行全面的認識之后,假想就沒有意義了,我們可以直接根據全面的數據做出結論。
大數據類的.讀書筆記2
數據、技能和思維的整合
粗度大數據時代。作者運用豐富的商業案例為讀者解釋了已經到來的大數據時代的特征,以及存在的種種機會。大數據的核心是數據,一切靠數據說話,這也就決定了大數據的最終玩家是掌握數據的公司,放眼全球,最有優勢的公司無疑是谷歌、亞馬遜。對于中國來講,搜索類公司百度,電商公司京東、亞馬遜、當當,B2C公司淘寶,社交公司人人、微博、騰訊等。這些公司掌握了大量的數據,但是究竟能不能做起來還需要看思維,阿里已經成立了研究院,值得看好,百度我還沒有看到有什么動靜,微博現在逐漸沒落,希望不要步人人網的侯成。
大數據將會是主流,這是和當今巨大的數據采集、存儲和處理方式決定的,可以說大數據強調的相關關系為人們快速而準確的判斷事物的發展規律提供了一種全新的思路,這是因為巨大的數據量,所以相關關系才顯得尤為重要。但也存在一個問題,如果只是關注事物之間的相關關系,而忽略了事物之間相關關系的內在原因,是否會是功利主義的又一次勝利?是否只是截取社會規律涌動洪流上的漂亮浪花,而忽略了內部真正的推動力量?
還有一點疑惑,如果只是從相關關系入手,那么得到的都將是已經存在的規律,預測的也是將會發生的事件,對于全新的事件將無法預測,創新性很難實現。這也是作者觀點非常不可取的地方。相關關系必然很重要,但是因果關系更加重要,而現在忽略因果關系的原因我認為本質上講是商業社會的逐利本質決定的,人們不可能花費大量的時間、金錢去探索一些對自己的利益提升沒有很大幫助的事情,而相關關系恰恰能最大限度的滿足人們快速獲利的動機。
總的來說,《大數據》這本書對于在商業層面大數據的運用是很有幫助的,在此基礎上,作者也從基于大數據的商業模式、社會管理手段以及社會所面臨的道德問題進行了簡單的探討,總的來說從宏觀上把握了已經到來的大數據時代,是一本不錯的類似讀物,但深度還略顯不足。
我相信大數據時代將給人們的生活帶來極大地便利以及促進整個社會資源配置效率的提高,這是大數據積極的一方面。但是從我個人來講,我不希望大數據包含自己生活的方方面面,我需要隱私,更重要的我希望自己能有新的生活軌跡,而不是按照自己之前的軌跡不斷的重復下去。畢竟,大數據時代所有關于未來的預測都是基于對以前的分析。這也是我最擔心的。
【大數據類的讀書筆記】相關文章:
小升初面試必考的5大類問題02-21
工科類畢業論文的答辯技巧大揭秘12-03
中文系三大類就業方向11-28
美國留學三大類獎學金申請條件10-21
中國十大醫藥類大學排名06-28
關于面試口語6大類問題齊分享03-18
中國十大醫藥類大學排行榜名單07-04
數據庫開題報告12-21
2017高考專業:管理學類六大熱門專業06-19
大學四級仔細閱讀三大類題型的答題技巧03-30