徘徊的大數據門前:五個真實的數據挖掘故事

2013-04-09 13:16:11  來源:中國企業家

  *利用大數據後,農夫山泉會發生管理變革嗎?YES

  *中國能製作出類《紙牌屋》的電視局嗎?NO

  *大數據可以給阿迪達斯帶來利潤嗎?YES

  *網易數據工程師可以當「媒婆」?YES

  *中國政府未來會開放數據嗎?YES

  *正在到來的數據革命改變政府、商業和我們的生活......

  文_本刊記者 周恒星 趙奕 伏昕 昝慧昉 李春暉 編輯_楊婧 房煜 王琦

  《紙牌屋》

  文_本刊記者 周恒星 趙奕 伏昕 昝慧昉 李春暉 編輯_楊婧 房煜 王琦

  就在製作這期「大數據專題」時,編輯部發生熱烈討論:什麼是大數據?編輯記者們旁征博引,試圖將數據堆砌的商業案例剔除,真正的、實用性強的數據挖掘故事留下。

  我們報道的是偽大數據公司?我們是否成為《駕馭大數據》一書的作者Bill Franks所稱的「大數據騙局」中的一股力量?同樣的質疑發生在阿裏巴巴身上。有消息稱,3月23日,阿裏巴巴以7000萬美元收購了一家移動開發者數據統計平台。這引發了專家們熱烈討論,它收購的真是一家大數據公司嗎?

  這些質疑並非沒有道理。

  中國確實沒有大數據的土壤。「差不多先生」、「大概齊」的文化標簽一直存在。很多時候,各級政府不太需要「大數據」,形成決策的關鍵性數據只有一個數字比率(GDP)而已;其二,對於行業主管機構來說,它們擁有大量原始數據,但它們還在試探、摸索數據開放的尺度,比如說,是開放原始數據,還是開放經過各種加工的數據?是轉讓給擁有更高級計算和儲存能力的大型數據公司,還是將數據開源,與各種各樣的企業共享?其三,數據挖掘的工具價值並沒有完全被認同。在這個領域,硬件和軟件的發展並不十分成熟。

  即便如此,沒有人否認數據革命的到來,尤其在互聯網行業。阿裏巴巴的馬雲將大數據作為戰略方向,百度的李彥宏用「框計算」來謀劃未來。即便是CBA(中國男子籃球職業聯賽)也學起了NBA(美國男籃職業聯賽)五花八門的數據統計、分析與挖掘。

  在過去兩年間,大量的資本投資一些新型數據工具公司,根據美國道瓊斯風險資源(Dow Jones VentureSource)的數據,在過去的兩年時間裏,11.7億美元流向了119家數據庫軟件公司。去年,SAP市值已經超過西門子,成為德國市值最高的上市公司,而這樣的業績部分得益於其數據庫軟件HANA的商業化,去年一年時間裏HANA帶給SAP3.92億歐元的收入,增長了142%。

  但是,大數據還沒法分析、挖掘出自己的直接變現能力。在截稿日時,我們再重新讀維克托·邁爾-舍恩伯格(Viktor Mayer-Sch鰊berger)的《大數據時代:生活、工作與思維的大變革》一書,作者相信,未來,數據會成為有價值的資產。假以時日,它會大搖大擺地進入資產負債表裏。

  案例1:農夫山泉用大數據賣礦泉水

  文_本刊記者 趙奕 編輯_房煜

  發揮你您的想象力,選擇您認為可是的答案

徘徊的大數據門前:五個真實的數據挖掘故事

  這裏是上海城鄉結合部九亭鎮新華都超市的一個角落,農夫山泉的礦泉水堆頭靜靜地擺放在這裏。來自農夫山泉的業務員每天例行公事地來到這個點,拍攝10張照片:水怎麼擺放、位置有什麼變化、高度如何……這樣的點每個業務員一天要跑15個,按照規定,下班之前150張照片就被傳回了杭州總部。每個業務員,每天會產生的數據量在10M,這似乎並不是個大數字。

  但農夫山泉全國有10000個業務員,這樣每天的數據就是100G,每月為3TB。當這些圖片如雪片般進入農夫山泉在杭州的機房時,這家公司的CIO胡健就會有這麼一種感覺:守著一座金山,卻不知道從哪裏挖下第一鍬。

徘徊的大數據門前:五個真實的數據挖掘故事

  胡健想知道的問題包括:怎樣擺放水堆更能促進銷售?什麼年齡的消費者在水堆前停留更久,他們一次購買的量多大?氣溫的變化讓購買行為發生了哪些改變?競爭對手的新包裝對銷售產生了怎樣的影響?不少問題目前也可以回答,但它們更多是基於經驗,而不是基於數據。

  從2008年開始,業務員拍攝的照片就這麼被收集起來,如果按照數據的屬性來分類,「圖片」屬於典型的非關係型數據,還包括視頻、音頻等。要係統地對非關係型數據進行分析是胡健設想的下一步計劃,這是農夫山泉在「大數據時代」必須邁出的步驟。如果超市、金融公司與農夫山泉有某種渠道來分享信息,如果類似圖像、視頻和音頻資料可以係統分析,如果人的位置有更多的方式可以被監測到,那麼攤開在胡健面前的就是一幅基於人消費行為的畫卷,而描繪畫卷的是一組組複雜的「0、1、1、0」。

  SAP全球執行副總裁、中國研究院院長孫小群接受《中國企業家》采訪時表示,企業對於數據的挖掘使用分三個階段,「一開始是把數據變得透明,讓大家看到數據,能夠看到數據越來越多;第二步是可以提問題,可以形成互動,很多支持的工具來幫我們做出實時分析;而3.0時代,信息流來指導物流和資金流,現在數據要告訴我們未來,告訴我們往什麼地方走。」

  SAP從2003年開始與農夫山泉在企業管理軟件ERP方面進行合作。彼時,農夫山泉僅僅是一個軟件采購和使用者,而SAP還是服務商的角色。

  而等到2011年6月,SAP和農夫山泉開始共同開發基於「飲用水」這個產業形態中,運輸環境的數據場景。

  關於運輸的數據場景到底有多重要呢?將自己定位成「大自然搬運工」的農夫山泉,在全國有十多個水源地。農夫山泉把水灌裝、配送、上架,一瓶超市售價2元的550ml飲用水,其中3毛錢花在了運輸上。在農夫山泉內部,有著「搬上搬下,銀子嘩嘩」的說法。如何根據不同的變量因素來控製自己的物流成本,成為問題的核心。

  基於上述場景,SAP團隊和農夫山泉團隊開始了場景開發,他們將很多數據納入了進來:高速公路的收費、道路等級、天氣、配送中心輻射半徑、季節性變化、不同市場的售價、不同渠道的費用、各地的人力成本、甚至突發性的需求(比如某城市召開一次大型運動會)。

  在沒有數據實時支撐時,農夫山泉在物流領域花了很多冤枉錢。比如某個小品相的產品(350ml飲用水),在某個城市的銷量預測不到位時,公司以往通常的做法是通過大區間的調運,來彌補終端貨源的不足。「華北往華南運,運到半道的時候,發現華東實際有富余,從華東調運更便宜。但很快發現對華南的預測有偏差,華北短缺更為嚴重,華東開始往華北運。此時如果太湖突發一次污染事件,很可能華東又出現短缺。」

  這種沒頭蒼蠅的狀況讓農夫山泉頭疼不已。在采購、倉儲、配送這條線上,農夫山泉特別希望大數據獲取解決三個頑症:首先是解決生產和銷售的不平衡,準確獲知該產多少,送多少;其次,讓400家辦事處、30個配送中心能夠納入到體係中來,形成一個動態網狀結構,而非簡單的樹狀結構;最後,讓退貨、殘次等問題與生產基地能夠實時連接起來。

  也就是說,銷售的最前端成為一個個神經末梢,它的任何一個痛點,在大腦這裏都能快速感知到。

  「日常運營中,我們會產生銷售、市場費用、物流、生產、財務等數據,這些數據都是通過工具定時抽取到SAP BW或Oracle DM,再通過Business Object展現。」胡健表示,這個「展現」的過程長達24小時,也就是說,在24小時後,物流、資金流和信息流才能匯聚到一起,彼此關聯形成一份有價值的統計報告。當農夫山泉的每月數據積累達到3TB時,這樣的速度導致農夫山泉每個月財務結算都要推遲一天。更重要的是,胡健等農夫山泉的決策者們只能依靠數據來驗證以往的決策是否正確,或者對已出現的問題作出糾正,仍舊無法預測未來。

  2011年,SAP推出了創新性的數據庫平台SAP Hana,農夫山泉則成為全球第三個、亞洲第一個上線該係統的企業,並在當年9月宣布係統對接成功。

  胡健選擇SAP Hana的目的只有一個,快些,再快些。采用SAP Hana後,同等數據量的計算速度從過去的24小時縮短到了0.67秒,幾乎可以做到實時計算結果,這讓很多不可能的事情變為了可能。

  這些基於飲用水行業實際情況反映到孫小群這裏時,這位SAP全球研發的主要負責人非常興奮。基於飲用水的場景,SAP並非沒有案例,雀巢就是SAP在全球範圍長期的合作夥伴。但是,歐美發達市場的整個數據采集、梳理、報告已經相當成熟,上百年的運營經驗讓這些企業已經能從容面對任何突發狀況,他們對新數據解決方案的渴求甚至還不如中國本土公司強烈。

  這對農夫山泉董事長鍾目炎目炎而言,精準的管控物流成本將不再局限於已有的項目,也可以針對未來的項目。這位董事長將手指放在一台平板電腦顯示的中國地圖上,隨著手指的移動,建立一個物流配送中心的成本隨之顯示出來。數據在不斷飛快地變化,好像手指移動產生的數字漣漪。

  以往,鍾目炎目炎的執行團隊也許要經過長期的考察、論證,再形成一份報告提交給董事長,給他幾個備選方案,到底設在哪座城市,還要憑借經驗來再做判斷。但現在,起碼從成本方面已經一覽無遺。剩下的可能是當地政府與農夫山泉的友好程度,這些無法測量的因素。

  有了強大的數據分析能力做支持後,農夫山泉近年以30%-40%的年增長率,在飲用水方面快速超越了原先的三甲:娃哈哈、樂百氏和可口可樂。根據國家統計局公布的數據,飲用水領域的市場份額,農夫山泉、康師傅、娃哈哈、可口可樂的冰露,分別為34.8%、16.1%、14.3%、4.7%,農夫山泉幾乎是另外三家之和。對於胡健來說,下一步他希望那些業務員搜集來的圖像、視頻資料可以被利用起來。

  獲益的不僅僅是農夫山泉,在農夫山泉場景中積累的經驗,SAP迅速將其複製到神州租車身上。「我們客戶的車輛使用率在達到一定百分比之後出現瓶頸,這意味著還有相當比率的車輛處於空置狀態,資源尚有優化空間。通過合作創新,我們用SAP Hana為他們特製了一個算法,優化租用流程,幫助他們打破瓶頸,將車輛使用率再次提高了15%。」

責任編輯: 豆豆
三項金融改革加快推進 或釋放最大紅利
隨着利率市場化改革進一步推進、人民幣匯率進入均衡區間、人民幣資本項目可兌換改革的進一步深化,以及存款保險制度的建立和實施,中國經濟正步入對外開放的轉型期。
大公資訊 中國 軍事 言論 圖片 財經 產經 金融 汽車 娛樂 明星 生活 科技 書畫 报纸 香港在線 國際 社會 教育 副刊 食品 會展 宏觀 體育 健康 女人 人物 歷史 專題