徐小良:
接下來白總給我們講的是物理地域空間,并且他講的是落地的物理地域空間商業(yè)化的應用,白總是北京華通人商用信息有限公司的總經(jīng)理,他演講的題目是《基于空間大數(shù)據(jù)的商業(yè)分析應用》,掌聲有請白總!
白歡朋:
大家上午好!
因為我在倒數(shù)第二個,快到吃飯的時間了,大家聽了兩天,我今天不會分享太多,就一個概念,一個應用,希望最少的東西讓大家記住。
一個概念是網(wǎng)格或者叫格網(wǎng),相當于用一個空間的緯度來看待數(shù)據(jù)和應用。然后我講一個應用,剛才呂總在分享的時候,大數(shù)據(jù)真正的價值,如果能把外圍的數(shù)據(jù),不管是調(diào)查數(shù)據(jù),還是網(wǎng)絡(luò)數(shù)據(jù),如果跟客戶的結(jié)果數(shù)據(jù)整合起來,這樣它的價值可能會更大。所以我今天分享的案例是把外部數(shù)據(jù)和內(nèi)部數(shù)據(jù)結(jié)合以后服務(wù)于應用。
這里面有一個概念,首先談為什么是空間數(shù)據(jù),大家想很多數(shù)據(jù)都是有空間緯度的。據(jù)說有80%以上的數(shù)據(jù)有空間的緯度,大家關(guān)注新聞,今年八月份有一張比較好玩的地圖叫世界地圖在網(wǎng)上流行,有一個網(wǎng)站被黑客攻擊了,大量會員的資料泄密,這里面相當于有五萬個城市的地圖,排在前面的是巴西的圣保羅、美國的紐約、悉尼,據(jù)說看了這張地圖,中國怎么樣,中國很萌,證明中國也在其列。
從昨天到今天,大家談的更多的是大數(shù)據(jù)。事實上我們把數(shù)據(jù)放在空間的緯度看,多重的數(shù)據(jù)疊加起來,它的意義會更大。所以我今天跟大家首先講一個思路或者是概念就是空間數(shù)據(jù),因為在我們這里面,現(xiàn)在傳統(tǒng)的空間。比如說運維、互聯(lián)網(wǎng)、去中間化,比如說中間網(wǎng)絡(luò)公司、百貨公司在關(guān)門,我們看空間重要不重要。
我最近有一個體會,今年十月份我到北海道,我想看一部電視劇,在國內(nèi)下載了一半,我想看結(jié)局的時候,來了一個授權(quán)在本地區(qū)。我想當你走到哪兒的時候,其實你都帶有位置的特征。因為最近我除了在政府講互聯(lián)網(wǎng)大數(shù)據(jù)的時候,另外一個詞講的比較多就是政府大數(shù)據(jù)。九月份政府出了大數(shù)據(jù)行動綱要,政府的數(shù)據(jù)不斷的向社會上開放,也變成了另外一個,有人把政府大數(shù)據(jù)變成統(tǒng)計資產(chǎn)。
所以說在過去,我們分析數(shù)據(jù)的時候,政府的數(shù)據(jù)不開放,所以你很難做很多數(shù)據(jù)的應用。五年前我去看美國,美國在兩千年開放了它的人口普查數(shù)據(jù)以后,利用人口的數(shù)據(jù)在上面做了很多商業(yè)開發(fā)和應用。所以我想第一個因素,我們?yōu)槭裁磥碚効臻g數(shù)據(jù)。我們的數(shù)據(jù)隨著商業(yè)數(shù)據(jù),政府和互聯(lián)網(wǎng)的數(shù)據(jù)也在不斷的開放。
現(xiàn)在我們做市場分析的時候,我們大家談的是消費者或者我們叫顧客,在這里面面對兩個用戶群,對于消費者來講,我們有14億的人口,這是我們巨大的紅利。對企業(yè)來講有2200萬企業(yè)的單位,劉教授也講了,現(xiàn)在每一年又近四百萬的企業(yè)在登記,企業(yè)也構(gòu)成了很大的消費市場。所以我想政府數(shù)據(jù)的開放跟我們做空間的分析成為一種可能。
現(xiàn)在我們的技術(shù),比如說空間的技術(shù),當然現(xiàn)在大家用到的導航技術(shù)等等,空間的技術(shù)很發(fā)達,這就是空間技術(shù)。為什么是網(wǎng)格技術(shù),我們做市場評估的時候,我們會用到人口的技術(shù),傳統(tǒng)政府統(tǒng)計的時候按照行政單位,不管是一線城市或者是二線城市,按照城市的劃分,包括甚至到區(qū)、街道、居委會的劃分。
實際上我們在做研究的過程當中,我們看一個商圈,理論上來講三公里的商圈或者是幾公里的商圈。但是實際上,因為受它的商業(yè)分布不同,包括像住宅的不同,甚至道路的不同,有沒有一條河流攔截。很多商圈是不規(guī)則的,我們做經(jīng)濟分析的時候,我們很難說用一個圓圈來代表。比如說我們想象北京王府井的商圈,是沿著王府井大街南北向發(fā)展,現(xiàn)在我們叫金源MALL萬柳商圈。當我們做市場分析的時候,傳統(tǒng)意義上按照行政比較大的數(shù)據(jù),很難滿足我們的需要。所以我們會想到能不能顆粒度更細,這里面我們提到網(wǎng)格。事實上我們按照中國的地圖或者是行政機構(gòu),按照格網(wǎng)劃分。比如說每平方公里或者我們知道是200×200,我們在做商業(yè)活動的時候,你的格網(wǎng)越小,你未來做商圈匯總或者是市場分析的時候,你應用的更靈活。
是不是越小越有意義,那倒不是,你做成50×50一棟樓分成兩部分也沒有意義。目前來看我們做的數(shù)據(jù)已經(jīng)做到200×200,我們覺得更有意義。200×200里面中間放什么東西呢?這些人到底都在哪里,通過這樣的網(wǎng)格分布,我們又能很清楚的知道人口分布在哪里。我在這里講的人口是普查的常住人口。當然我們看一個區(qū)域,怎么比較這兩個區(qū)域之間的差異,除了人口以外,當然比如說他的收入指標、經(jīng)濟狀況,甚至比如說他的汽車分布,以及燈光的數(shù)據(jù)。
當我們看城市發(fā)展的時候,當我們俯瞰一個城市的時候,特別是進行比較的時候,你特別能看到北京不斷的向外面擴展。我們有時候看到一組數(shù)據(jù),有一個城市的燈很亮,事實上我到那個城市做調(diào)查的時候,發(fā)現(xiàn)那個城市是鬼城,政府為了讓老百姓住在那里,住的人少怎么樣,對開發(fā)商有一個要求,晚上必須把燈開著,尤其是在沒有交房之前把燈開著,單一的指標不能反應真正的人口分布。
現(xiàn)在我們想把盡可能有的數(shù)據(jù),目前的網(wǎng)格數(shù)據(jù)我們跟中科院地理所合作,包括遙感的數(shù)據(jù),人口的數(shù)據(jù),當然我們大概有十五種數(shù)據(jù)整合在一起做網(wǎng)格。
未來利用移動數(shù)據(jù)可以解決它的流動人口問題,還會有其他的辦法,不管怎么樣,有了網(wǎng)格的化,我們在商業(yè)的選址和網(wǎng)點的優(yōu)化,包括我們做精準的營銷成為一種可能。在目前方面因為受隱私的影響,我們到不了人可能到區(qū)域,這樣的話網(wǎng)格就有它的意義。在空間的研究過程中間,如果我們把更多的數(shù)據(jù)放在網(wǎng)格里,當然網(wǎng)格有一個好處,當多一種數(shù)據(jù)放在一個格子里面比較的時候,可能得出來的意義比較明顯,這是我們提的空間智能的思路。
這是我們看到格網(wǎng),我們把全國按照人口、土地、交通等等活動情況,我們做成200×200的格網(wǎng),實際上在兩年前我們跟美國密西根大學合作的時候,當時做到每平方公里,大家可以看看下面兩張圖是不一樣的,一個是一平方公里人口分布的情況。另外一側(cè)是200×200的,你會發(fā)現(xiàn)如果它的顆粒度越細,可能反應一個地方真實的情況會更準。
我們可以看有一些地方標0的,說明這個地方有湖泊或者是沙漠,我們可以把整個基于政府統(tǒng)計的數(shù)據(jù),因為大家也知道,比如說當我們要求總量數(shù)據(jù)的時候,沒有任何一家商業(yè)公司能做出來,必須依靠政府的資源。政府的數(shù)據(jù)并沒有告訴我說,到這個區(qū)域里面大概有多少人。大家可以看到這完全可以根據(jù)建筑物,根據(jù)燈光把人口的密度分攤到每一個格子里面去。
利用這個格子以后,這是一個基本的概念,比如說我們基于自身的人口數(shù)據(jù),接上我們遙感的數(shù)據(jù)形成格網(wǎng)化的數(shù)據(jù)。比如說我們有一個應用,舉一個簡單的例子,我們的客戶做網(wǎng)點優(yōu)化,這是加油站的案例,有的加油站做的好,有的加油站做的不好,怎么判斷加油站好壞,除了經(jīng)營的狀況,這個人有沒有能力以外,也會有其他的情況,我們把經(jīng)濟、人口、汽車所有的數(shù)據(jù)整合到這里面,這是分析的辦法。
基本的邏輯,我們認為整個地區(qū)它的經(jīng)濟或者是跟它的消費數(shù)據(jù)相關(guān)的因素越集中的地方,它的潛力應該越大。我們會根據(jù)這樣來做一個優(yōu)化的建議,事實上我們到北京來看,這是北京在五環(huán)里面加油站和人口分布的情況。另外一個排名的情況,紅色的是人口的得分,藍色的是客戶內(nèi)部的數(shù)據(jù)。我們看人口的分布和內(nèi)部的績效,我們把客戶可以提供的大概的加油站進行比較。比如說這是跟經(jīng)濟的關(guān)系比較,跟周邊的商業(yè)環(huán)境,我們的商業(yè)網(wǎng)點。由于商業(yè)網(wǎng)點是集客的方式,在每一個因素過程當中,我們要算出來每一個因素對它的貢獻度是怎么樣的。包括周邊和交通的空間分布,積極像汽車的分布情況。
通過這個我們可以得出來,這個客戶在北京來講,排在最好的是月壇的加油站。因為那個地方大家能想到二環(huán)邊上,那邊是政府,這邊是金融街,應該是商業(yè)或者是經(jīng)濟比較繁華的。大家這里面也會有問題,總體上我們看這個趨勢,我們的市場潛力和內(nèi)部客戶的數(shù)據(jù)還是相吻合的,比如說我們排在華威路的,從潛力上來講,它的客戶排31名,我們現(xiàn)場調(diào)查可以解決的問題。
這里面找出來差異性很大的去看,我們又重新算了一遍,發(fā)現(xiàn)它應該做的更好,為什么呢?這里面發(fā)現(xiàn)整個布局有問題,加油站門前有一個建筑物擋了它的道。所以在這些方面,它進出很不方便,影響了它的效率。類似這樣我們一手調(diào)研,通過現(xiàn)場的數(shù)據(jù)進行補充,我們給客戶很好的合理化的建議。
我們想一想,如果客戶把全國的加油站給我的時候,如果這個模型整理的話,我會基本上對所有的加油站的經(jīng)營情況進行一個排名,你怎么運籌千里之外,可以用這個決策功能實現(xiàn),謝謝大家。
徐小良:
謝謝白總。