
人們一直對(duì)平均數(shù)深信不疑,最經(jīng)典的就是簡(jiǎn)單算數(shù)平均數(shù),以為這個(gè)公式算出的結(jié)果就是對(duì)的,真的嗎?給大家一個(gè)實(shí)際的例子,大家就會(huì)知道,“數(shù)據(jù)”這個(gè)東西絕對(duì)不是幾個(gè)學(xué)過編程的人,代入幾個(gè)公式就可以搞明白的。數(shù)據(jù)需要分析才能得出正確的結(jié)果。
以下是本人2010年發(fā)表在《中國(guó)經(jīng)營(yíng)報(bào)》的小文。
新房?jī)r(jià)統(tǒng)計(jì)方法有數(shù)據(jù)陷阱
劉德寰
國(guó)家統(tǒng)計(jì)局最近公布了《住宅銷售價(jià)格統(tǒng)計(jì)調(diào)查方案(征求意見稿)》,這是一個(gè)歷史性的進(jìn)步,說明統(tǒng)計(jì)局不再我行我素不考慮社會(huì)的觀點(diǎn)了。該調(diào)查方案有兩點(diǎn)進(jìn)步:給出了房?jī)r(jià)計(jì)算的基本公式,透明度增加;在資料收集方法上進(jìn)行了大的改進(jìn)。但筆者詳細(xì)驗(yàn)證后發(fā)現(xiàn),這些改進(jìn)無(wú)法使房?jī)r(jià)計(jì)算更加科學(xué),還會(huì)導(dǎo)致嚴(yán)重失真的結(jié)果,甚至可能繼續(xù)出現(xiàn)類似“2009年70個(gè)大中城市房屋銷售價(jià)格上漲1.5%”等讓人匪夷所思的統(tǒng)計(jì)數(shù)據(jù)。
我們以“本月及上月平均價(jià)格計(jì)算公式”(見“住宅銷售價(jià)格統(tǒng)計(jì)調(diào)查方案公開征求意見”)為例,來(lái)考察統(tǒng)計(jì)局房?jī)r(jià)計(jì)算方式存在的問題。
在統(tǒng)計(jì)局現(xiàn)有房?jī)r(jià)計(jì)算方式中,“新建住宅銷售價(jià)格指數(shù)”的計(jì)算步驟為:第一,計(jì)算某一新建住宅樓盤90平方米及以下、90平方米~144平方米、144平方米以上三個(gè)基本分類的環(huán)比指數(shù);第二,采用雙加權(quán)計(jì)算全市三個(gè)基本分類的環(huán)比指數(shù),即分別利用本月銷售面積和金額作為權(quán)數(shù)計(jì)算價(jià)格指數(shù),然后將兩個(gè)價(jià)格指數(shù)再簡(jiǎn)單平均;第三,計(jì)算保障性住房環(huán)比價(jià)格指數(shù),計(jì)算方法與商品住宅基本分類計(jì)算方法一致。
這一房?jī)r(jià)計(jì)算方式有兩個(gè)嚴(yán)重問題:一是所謂樓盤的三個(gè)基本分類,其分類方式不合理,我們知道,同樣是90平方米的房子,城市中心與城市邊緣的價(jià)格差異非常大,這樣簡(jiǎn)單的三個(gè)分類,方法武斷而且沒有分析意義;二是“利用本月銷售面積和金額作為權(quán)數(shù)計(jì)算價(jià)格指數(shù)”,這一定會(huì)陷入到數(shù)據(jù)陷阱之中。我們舉一個(gè)數(shù)據(jù)的例子來(lái)說明這個(gè)問題:
該城市最近三個(gè)月的銷售與價(jià)格情況
第一月 |
銷售總平米 |
成交均價(jià) |
銷售額 |
甲區(qū) |
50000 |
30000 |
1500000000 |
乙區(qū) |
30000 |
25000 |
750000000 |
丙區(qū) |
40000 |
18000 |
720000000 |
丁區(qū) |
20000 |
17000 |
340000000 |
合計(jì) |
140000 |
|
3310000000 |
第二月 |
銷售總平米 |
成交均價(jià) |
銷售額 |
甲區(qū) |
20000 |
33000 |
660000000 |
乙區(qū) |
30000 |
27500 |
825000000 |
丙區(qū) |
50000 |
19800 |
990000000 |
丁區(qū) |
40000 |
18700 |
748000000 |
合計(jì) |
140000 |
|
3223000000 |
第三月 |
銷售總平米 |
成交均價(jià) |
銷售額 |
甲區(qū) |
5000 |
36300 |
181500000 |
乙區(qū) |
10000 |
30250 |
302500000 |
丙區(qū) |
40000 |
21780 |
871200000 |
丁區(qū) |
50000 |
20570 |
1028500000 |
合計(jì) |
105000 |
|
2383700000 |
假設(shè)一個(gè)城市中,按照90平方米以下新房屋基本平均銷售價(jià)來(lái)看,甲、乙、丙、丁四個(gè)區(qū)域價(jià)格不同,距離城市中心依次越來(lái)越遠(yuǎn),最近三個(gè)月所有區(qū)域成交均價(jià)每個(gè)月都上漲了10%,但是四個(gè)區(qū)域的新房銷售結(jié)構(gòu)在這三個(gè)月中是不同的(以北京為例,三環(huán)以內(nèi)新房供應(yīng)越來(lái)越少,四環(huán)以內(nèi)也在減少,五環(huán)之內(nèi)有所增加,六環(huán)之內(nèi)大量增加)。
沒有學(xué)過統(tǒng)計(jì)的人都能夠看出,這個(gè)城市最近三個(gè)月房?jī)r(jià)最終上漲了21%,但是統(tǒng)計(jì)局的計(jì)算公式是以整個(gè)城市新房總成交價(jià)除以城市銷售總面積,算出所謂的“成交均價(jià)”,因?yàn)榍懊嫣岬降牡蛢r(jià)房銷售面積上升、高價(jià)房銷售面積下降的原因,就會(huì)發(fā)現(xiàn)這樣算出的三個(gè)月的成交均價(jià)分別為:23642.857元、23021.429元、22701.9元,房?jī)r(jià)分別下跌了2.63%和1.39%,合計(jì)下跌4 %。“21%”與“-4%”,多么可怕的差異!
如果還是這個(gè)銷售結(jié)構(gòu),每個(gè)區(qū)域每月成交均價(jià)都上漲15%,三個(gè)月房?jī)r(jià)實(shí)際上漲了32%以上,但是按照統(tǒng)計(jì)局的計(jì)算公式,房?jī)r(jià)分別上漲了1.8%和3%,合計(jì)上漲5%左右。
還是在這個(gè)銷售結(jié)構(gòu)中,每個(gè)區(qū)域每月成交均價(jià)都上漲20%,三個(gè)月房?jī)r(jià)實(shí)際上漲了44%,但是按照統(tǒng)計(jì)局的計(jì)算公式,房?jī)r(jià)分別上漲了6.22%和7.58%,合計(jì)上漲15%左右。
這說明統(tǒng)計(jì)局的計(jì)算方式存在嚴(yán)重失誤。因?yàn)樗凿N售結(jié)構(gòu)決定房?jī)r(jià)上升與下降,而不是以房?jī)r(jià)漲跌本身來(lái)決定,這是在數(shù)據(jù)分析中最常見的一種數(shù)據(jù)陷阱。如果未來(lái)我們國(guó)家關(guān)于房?jī)r(jià)計(jì)算的方式存在這么大的失誤,會(huì)嚴(yán)重影響決策部門對(duì)真實(shí)樓市情況的了解,誤導(dǎo)公眾。
上述問題不僅僅是統(tǒng)計(jì)部門犯的錯(cuò)誤,也是建設(shè)部門和一些所謂的房?jī)r(jià)監(jiān)控部門犯的錯(cuò)誤。中國(guó)房?jī)r(jià)計(jì)算方式需要大的改進(jìn)。