由於晶片效能不斷地提升,數位科技處理資料的能力也跟著水漲船高,因此大數據(big data)的應用越來越廣泛,許多決策與行為都依賴大數據與演算法來實施。這是一個可悲的現象,也是一個迷信的時代,光是探究誰會擁有大數據?誰在制定演算法?民眾就應該集體覺醒,切莫成為資料獨裁(dictatorship of data)者的奴隸。只有人們不迷信大數據,並懂得如何反向操作還原真相,大數據才能成為你可使用的工具。根據《大數據》一書作者麥爾荀伯格的定義,大數據要的是大雜燴的巨量資料,也就是蒐集全部的資料,使得資料處理的樣本等於母體。過去還無法蒐集與處理巨量資料的時期,多是使用隨機抽樣的方法來預測,根據數學統計的原理,那麼誤差只會在3%的範圍之內,是一項相當可靠的科學方法。然而時至今日,各項抽樣調查也屢屢失誤,甚至與結果完全相反,民調已成為刻意操控的工具,客觀的環境不復存在。 |