1、基尼系數(shù)?;嵯禂?shù)的描述引自百度:
http://baike.baidu.com/view/186.htm
計算基尼系數(shù)使用洛倫茲曲線(見下圖紅色曲線)
通過大范圍采樣,可獲得一財富排序表——按每個人的財富大小自左至右依次排列。即,排序表中任何一人都比左邊相鄰的人富有。
上圖的橫標:排序表中任何一人及左邊所有人之和占總?cè)藬?shù)的百分比;縱標是:上述人群的財產(chǎn)之和占排序表總財產(chǎn)之和的百分比。圖中的對角線AC(綠線)表示所有人財產(chǎn)相等(絕對平均);紅綠線圍成的面積代表了貧富差距,這一面積與三角形ABC的面積之比就是基尼系數(shù)。注意,此圖縱橫兩軸采用了不同的比例尺。若比例尺相同,該圖形應(yīng)該是正方形,這不影響統(tǒng)計結(jié)果。
圖中做另一對角線BD,其中EB段是“財富倒掛點”的軌跡,與紅線相交于F,該點橫標為X(下同),則F點即洛倫茲曲線的倒掛點?!暗箳臁钡暮x是,X%的人群擁有(100-X)% 的財富。該圖的中,X=60,不妨稱為“四六倒掛”。
2、用“倒掛折線”粗略計算基尼系數(shù)。
圖中,作折線AFC,以近似代替洛倫茲曲線。則三角形AFC與三角形ABC的面積之比即為基尼系數(shù)Y的近似值,
Y > 1-0.02*x (x=0,1,2....50) (1)
(1)式右端是用小學高年級算三角形、正方形面積的方法演繹而來,不贅述;其中不等號“>”的意義是:三角形AFC的面積總小于紅綠線圍成的面積,且“倒掛”越嚴重,其誤差越大。依次計算四六、三七、二八倒掛的基尼系數(shù)分別是 0.2,0.4,0.6 。由曲線特征可以推斷,四六倒掛的基尼系數(shù)0.2誤差不大,而二八倒掛的實際基尼系數(shù)可能遠不止0.6(見后)。
3、十個人的基尼系數(shù)
假設(shè)有代表性的10個人(也可以代表10個家庭或大范圍中10%的采樣人群平均值)的財產(chǎn)折合成人民幣(單位為萬元),從小到大依次排序的表格(見第一行)如下:
1 2 3 4 5 6 7 8 9 10
1 7.5 9.0 20 45 100 225 500 1100 2500 5500
2 7.5 16.5 36.5 81.5 181.5 406.5 906.5 2006 4500 10000
3 0.075 0.165 0.365 0.815 1.815 4.065 9.065 20.06 45 100%
第一行左邊第一位財產(chǎn)有7.5萬元。譬如某農(nóng)家收入比較拮據(jù),積攢多年建了新房,沒有或有少量存款。從左到右一個比一個富裕,到第10位,就有5500萬財產(chǎn)了。
第二行的第二個數(shù)據(jù)是第一行的第一、二人的財產(chǎn)相加;第三個數(shù)據(jù)是前一二三個人的財產(chǎn)相加,以此類推。所以,第10個數(shù)據(jù)是10個人的總財產(chǎn),是一億元(列表時忽略了后面較大數(shù)據(jù)的個位數(shù),對統(tǒng)計結(jié)果影響不明顯)。
第三行是把第二行的“萬元”數(shù)用百分比表示,基數(shù)為10個人的總財產(chǎn)即一億元。以下分析把第一行所屬的第x個人看成是采樣人群的百分比10*X%。例如第3位代表前30%的人口。這樣就可以建立由排序表得到的人口百分比與這些人的財產(chǎn)總值百分比的函數(shù)關(guān)系,即前述的洛倫茲曲線。從第三行第八列可看出,這一組數(shù)據(jù)屬典型的“二八倒掛”。
為了便于積分計算,將該曲線擬合成一指數(shù)函數(shù)式,其精度可用第三行數(shù)據(jù)驗證:
y = 0.0336*exp(0.08*x)(%) -----(2)
注意(1)式的Y是基尼系數(shù),介于(0-1)之間;(2)式的y是洛倫茲曲線的縱標,x、y的取值范圍都是(0-100)。(2)式用指數(shù)函數(shù)擬合的缺點是y不能從0值開始。例如將x=0帶入得:y=0.0336%,這對計算面積影響甚微。
積分時,被積函數(shù)是直線 y=x 與(2)式之差,積分上下限是(100-0)。將積分結(jié)果再除以三角形ABC面積(=5000),可得到此時的基尼系數(shù):
Y = 1-{0.42(exp(8)-1)}/5000 = 0.75 (3)
這一組二八倒掛的數(shù)據(jù)的基尼系數(shù)竟達0.75,與(1)式的0.6相差很大!換一組數(shù)據(jù)也許有點出入,但估計誤差不大。這意味著,如果承認“二八倒掛”,基尼系數(shù)決不是目前媒體公布的0.61 !