二、大數據和機器智能的井噴式爆發
大數據這個概念在今天這個時間點被提出來,其根本原因是因為摩爾定律導致互聯網的發展,進而使得各種數據量的急劇增長(圖5,數據增長的速度快于互聯網本身增長的速度)。因此,大數據的第一個來源是互聯網,包括移動互聯網。大數據的產生還有第二個原因,就是傳感器技術的突破--今天各種手機,各種可穿戴式設備都有非常精準的傳感器。而一些傳感器價格非常便宜(比如RFID,每個售價僅四美分),使得每一個物品都可以裝上一個。這些傳感器產生了大量的數據。
圖5. 數據的增長速度(最上端的黑線)快于互聯網的增長速度(數據來源:美國Gartner公司)
那么大數據能有多么完備?未來的機器能有多么“聰明”?我們看兩個極端的例子。
1.精確到每一個細節
我們來構造兩個場景,一個是關于物品,一個是關于人。
我們假定在未來的社會里,每一件物品上都貼有一個RFID(指甲蓋大小的不干膠),那么它每經過一道(裝有RFID閱讀器)門,都可以記錄下來,這樣我們可以追蹤它從出廠一直到被消費掉(或者最終銷毀掉)的每一步。將來顧客在超市買東西時,他不再需要在收銀臺前排隊,然后一件件掃描商品算賬,而只需要把購物車推出裝有RFID閱讀器的大門,而那個閱讀器將讀出他購物車里每一件商品,并且算出價錢。不僅如此,他還能知道商品的來源,這樣假貨就難有藏身之處。對于廠家來講,它的意義就更大了,大數據可以能建立起廠家和終端用戶的直接聯系。以前,廠家和客戶之間或多或少隔著一些經銷商,因此只能了解自己產品大致的銷售情況(比如哪個地區賣了多少),而無法了解細節(比如哪個收入階層在消費,各個流通環節加價多少等)。但是在大數據時代,它不僅能夠知道每一件商品買給了誰,甚至能知道中間每一個流通環節里的細節。因此,它可以完全根據市場供需進行生產,而且可以減少中間環節。對于政府的稅收部門,如果可以備份每一筆交易的每一個細節,保證每一筆稅收。當時,實現這一切需要多少IT投入,什么時候可以完成現在尚難估計。
接下來談談對人的精細化了解。從理論上講,在大數據時代完全有條件了解每一個人24小時的全部行程。對于使用手機的人,這件事很容易做到。Google向智能手機和Chrome的用戶提供一個被稱為Google Now的個人資訊服務,它通過大數據(利用多維度的特點)將用戶在日常生活中使用的很多(網絡)服務打通,讓使用者可以非常方便地管理每一天的生活。比如,它通過紀錄使用者不同時間所在的位置,自動了解他的住址和上班的地點,每天上下班前,通知用戶路上所需要的時間和比較好的行程路線,同時也能通知用戶沿路可能發生的擁堵和交通事故。它還可以根據用戶的通信(比如郵件),幫助用戶自動地將每天的活動自動地加到日歷中并且及時提醒下一個活動。事實上,用戶在獲得這種方便性的同時,將每天的活動全部交給了Google來管理。只要再做進一步的數據挖掘,擁有這樣大數據的公司和機構(不一定需要是手機制造商和服務運營商),不僅可以知道一個人任何時刻的位置,而且可以知道他在做什么(比如在打電話,寫郵件,開會或者工作)等等,甚至可以知道在什么時候他和什么人見了面(比如兩個人在某個地方一起吃了一小時午飯,吃的是什么飯)。對于沒有使用手機的人來講,雖然不能獲得如此詳盡的信息,每天的活動也是有辦法知道的。比如只要他身上任何一件物品是可以識別,或者他的一些生物特征(臉譜、指紋、聲音等)可以識別,再經過大數據分析,也能比較詳盡地了解這個人的活動。在過去,針對非常少量的人,如果不計成本的話,這件事情也能辦到,但是不可能針對大范圍的人,而在大數據和機器智能使得了解每一個人的生活變成了可能。
大數據和機器智能的發展,必將使得“機器”能夠準確地了解社會的每一個細節。因此,具有最強大智能機器的不是哪一個具體的機器人,而是超級數據中心后面幾十萬,上百萬的服務器集群。而掌控這個集群的人實際上在掌控這個社會發生的一切。
2.對醫療衛生的影響
近幾十年來,雖然人類的壽命在不斷地延長,但這在很大程度上是靠技術手段,而不是醫療本身水平的提高。事實上,提高醫療水平是一個非常漫長的過程,而過去研制新的藥品和醫療手段亦是如此。醫療健保的費用不斷增加,而且照此下去各國將是不堪負荷的,據估計到2020年,美國用于醫療健保的費用將達到GDP的20%左右。
那么出路在哪里?今天IT界和醫學界領域都有一個共識,就是通過IT的進步,尤其是大數據和機器智能的進步,幫助解決人類健康的問題。當然,這個話題很大大,我們可以從三個側面來看看在未來IT技術對生物醫療的幫助。
首先,藥品的研制。攻克癌癥是人類的一個夢想,但是迄今為止沒有一種特效的抗癌藥能夠治愈癌癥。過去醫學界還試圖研制這樣的抗癌藥,但是后來醫學界認識到,由于癌細胞本身的基因會變異,因此并不存在這樣一種萬能藥。基于這一點共識,醫學界改變了治療癌癥的思路,那就是針對特定患者(不斷變化的癌細胞),研制特定的藥物,從理論上講,只要研制的速度超過癌細胞變化的速度,癌癥就可以治愈了。
按照傳統的藥品研發思路,科學家們應該先研究病理,找到解決方法(比如阻止具有某種基因的癌細胞蛋白質的合成),然后找到相應的藥物,進行各種動物實驗和臨床試驗。這是我們前面提到的強調因果關系的工作方法。但是,按照這個思路,為每一位癌癥患者研制一種新藥是很難辦到的。且不說制藥公司能否安排一個專門的團隊為一個特定的患者服務,就算是能做到這一點,研制新藥的成本也是患者無法負擔的-平均一個人要十億美元(基因泰克公司董事長李文森博士的估計)。事實上,不僅研制抗癌藥成本高周期長,在美國,任何一種有效的處方藥研制的時間和費用都非常高。過去大約需要十年時間,十億美元,今天這個過程并沒有縮短,而成本甚至上升到近百億美元。
轉載請注明:北緯40° » 大數據、機器智能和未來社會的圖景