什麼叫洛倫茲曲線，什麼叫基尼係數，我國的基尼係數偏大說明什麼問題

1樓：科普小星球

1、洛倫茲曲線

洛倫茲曲線（lorenz curve），也譯為「勞倫茲曲線」。指在一個總體（國家、地區）內，以「最貧窮的人口計算起一直到最富有人口」的人口百分比對應各個人口百分比的收入百分比的點組成的曲線。

為了研究國民收入在國民之間的分配問題，美國統計學家m.o.洛倫茲（max otto lorenz，1876- 1959）2023年提出了著名的洛倫茲曲線。

洛倫茲曲線用以比較和分析一個國家在不同時代或者不同國家在同一時代的財富不平等，該曲線作為一個總結收入和財富分配資訊的便利的圖形方法得到廣泛應用。通過洛倫茲曲線，可以直觀地看到一個國家收入分配平等或不平等的狀況。

洛倫茲曲線的彎曲程度有重要意義。一般來講，它反映了收入分配的不平等程度。彎曲程度越大，收入分配越不平等，反之亦然。

2、基尼係數

基尼係數是指國際上通用的、用以衡量一個國家或地區居民收入差距的常用指標，最早由義大利統計與社會學家corrado gini在2023年提出。

基尼係數最大為「1」，最小等於「0」。基尼係數越接近0表明收入分配越是趨向平等。國際慣例把0.

2以下視為收入絕對平均，0.2-0.3視為收入比較平均；0.

3-0.4視為收入相對合理；0.4-0.

5視為收入差距較大，當基尼係數達到0.5以上時，則表示收入懸殊。

國內不少學者對基尼係數的具體計算方法作了探索，提出了十多個不同的計算公式。山西農業大學經貿學院張建華先生提出了一個簡便易用的公式：

假定一定數量的人口按收入由低到高順序排隊，分為人數相等的n組，從第1組到第i組人口累計收入佔全部人口總收入的比重為wi，則說明：該公式是利用定積分的定義將對洛倫茨曲線的積分分成n個等高梯形的面積之和得到的。

3、我國的基尼係數偏大，說明我國的收入差距仍然過大，貧富差距較大，尚未達到理想的平均水平。

擴充套件資料

洛倫茲曲線和基尼係數的關係是：

將洛倫茲曲線與45度線之間的部分（a）叫做「不平等面積」，當收入分配達到完全不平等時，洛倫茲曲線與45度線之間的面積（a+b）叫做「完全不平等面積」。不平等面積與完全不平等面積之比，就是基尼係數，是衡量一國貧富差距的標準。

因此，基尼係數也可以通過洛倫茲曲線的作圖和積分求解，公式為g=a/(a+b)。從公式上推斷，基尼係數不會大於1，也不會小於零。

2樓：拓端資料科技

> (income=sort(income))[1] 19246 23764 53237 61696 218835

為什麼說這個樣本中存在不平等？如果我們看一下最貧窮者擁有的財富，最貧窮的人（五分之一）擁有5％的財富；倒數五分之二擁有11％，依此類推

> income[1]/sum(income)[1] 0.0510> sum(income[1:2])/sum(income)[1] 0.1140

如果我們繪製這些值，就會得到洛倫茲曲線

> plot(lorenz(income))> points(c(0:5)/5,c(0,cumsum(income)/sum(income))

現在，如果我們得到500個觀測值。直方圖是視覺化這些資料分佈的方法

> summary(income)min. 1st qu. median mean 3rd qu.

max. 2191 23830 42750 77010 87430 2003000 > hist(log(income),

在這裡，我們使用直方圖將樣本視覺化。但不是收入，而是收入的對數（由於某些離群值，我們無法在直方圖上視覺化）。現在，可以計算基尼係數以獲得有關不平等的一些資訊

> gini=function(x){+ mu=mean(x)+ g=2/(n*(n-1)*mu)*sum((1:n)*sort(x))-(n+1)/(n-1)

實際上，沒有任何置信區間的係數可能毫無意義。計算置信區間，我們使用boot方法

> g=boot(income,gini,1000)> hist(g,col="light blue",border="white"

紅色部分是90％置信區間，

5% 95%0.4954235 0.5743917

還包括了一條具有高斯分佈的藍線，

> segments(quantile(g,.05),1,quantile(g,.95),1,> lines(u,dnorm(u,mean(g),sd(g)),

另一個流行的方法是帕累託圖（pareto plot），我們在其中繪製了累積生存函式的對數與收入的對數，

> plot(x,y)

如果點在一條直線上，則意味著可以使用帕累託分佈來建模收入。

前面我們已經看到了如何獲得洛倫茲曲線。實際上，也可以針對某些引數分佈（例如，一些對數正態分佈）獲得lorenz曲線，

> lines(lc.lognorm,param=1.5,col="red")> lines(lc.

lognorm,param=1.2,col="red")> lines(lc.lognorm,param=.

8,col="red")

在這裡，對數正態分佈是一個很好的選擇。帕累託分佈也許不是：

> lines(lc.pareto,param=1.2,col="red")

實際上，可以擬合一些引數分佈。

shape rate1.0812757769 0.0140404379(0.0604530180) (0.0009868055)

現在，考慮兩種分佈，伽馬分佈和對數正態分佈（適用於極大似然方法）

shape rate1.0812757769 0.0014040438(0.

0473722529) (0.0000544185)meanlog sdlog6.11747519 1.

01091329(0.04520942) (0.03196789)

我們可以視覺化密度

> hist(income,breaks=seq(0,2005000,by=5000),+ col=rgb(0,0,1,.5),border="white",+ fit_g$estimate[2])/1e2+ fit_ln$estimate[2])/1e2> lines(u,v_g,col="red",lwd=2)> lines(u,v_ln,col=rgb(1,0,0,.4),lwd=2)

在這裡，對數正態似乎是一個不錯的選擇。我們還可以繪製累積分佈函式

> plot(x,y,type="s",col="black",xlim=c(0,250000))+ fit_g$estimate[2])+ fit_ln$estimate[2])> lines(u,v_g,col="red",lwd=2)

現在，考慮一些更現實的情況，在這種情況下，我們沒有來自調查的樣本，但對資料進行了合併，

對資料進行建模，

fit(id=rep("data",n),time difference of 2.101471 secsfor lno fit across 1 distributions

我們可以擬合對數正態分佈（有關該方法的更多詳細資訊，請參見從合併收入估算不平等的方法）

> y2=n/sum(n)/diff(income_binned$low)+ fit_ln$parameters[2])> plot(u,v,col="blue",type="l",lwd=2)> for(i in 1:(n-1)) rect(income_binned$low[i],0,+ income_binned$high[i],y2[i],col=rgb(1,0,0,.2),

在此，在直方圖上（由於已對資料進行分箱，因此很自然地繪製直方圖），我們可以看到擬合的對數正態分佈很好。

> v <- plnorm(u,fit_ln$parameters[1],+ fit_ln$parameters[2])> for(i in 1:(n-1)) rect(income_binned$low[i],0,> for(i in 1:(n-1)) rect(income_binned$low[i],+ y1[i],income_binned$high[i],c(0,y1)[i],

對於累積分佈函式，我考慮了最壞的情況（每個人都處於較低的收入中）和最好的情況（每個人都具有最高可能的收入）。

也可以擬合廣義beta分佈

gb_family(id=rep("fake data",n),

為了獲得最佳模型，檢視

> fits[,c("gini","aic","bic")]

結果很好，接下來看下真實資料：

fit(id=rep("us",n),+ distribution=lno, distname="lno"time difference of 0.1855791 secsfor lno fit across 1 distributions

同樣，我嘗試擬合對數正態分佈

> v=dlnorm(u,fit_ln$parameters[1],> plot(u,v,col="blue",type="l",lwd=2)> for(i in 1:(n-1)) rect(data$low[i],

但是在這裡，擬合度很差。同樣，我們可以估算廣義beta分佈

>gb_family(id=rep("us",n),+ id_name="country")

可以得到基尼指數， aic 和bic

gini aic bic1 4.413431 825368.5 825407.

32 4.395080 825598.8 825627.

93 4.451881 825495.7 825524.

84 4.480850 825881.7 825910.

85 4.417276 825323.6 825352.

76 4.922122 832408.2 832427.

67 4.341036 827065.2 827084.

68 4.318667 826112.8 826132.

29 na 831054.2 831073.610 na na na

看到最好的分佈似乎是廣義伽瑪分佈。

最受歡迎的見解

1.r語言泊松poisson迴歸模型分析案例

2.r語言進行數值模擬：模擬泊松迴歸模型

3.r語言泊松迴歸分析

4.r語言對布豐投針（蒲豐投針）實驗進行模擬和動態視覺化

5.用r語言模擬混合制排隊隨機服務排隊系統

6.garch（1,1），ma以及歷史模擬法的var比較

7.r語言做複雜金融產品的幾何布朗運動的模擬

8.r語言進行數值模擬：模擬泊松迴歸模型

9.r語言對巨災風險下的再保險合同定價研究案例：廣義線性模型和帕累託分佈pareto distributions

什麼叫洛倫茲曲線，什麼叫基尼係數，我國的基尼係數偏大說明什麼問題

洛倫茲力產生的原因是什麼

什麼叫要素的需求曲線，什麼是需求曲線？

什麼叫蝸桿的特性係數,蝸桿的直徑係數問題

什麼叫洛倫茲曲線，什麼叫基尼係數，我國的基尼係數偏大說明什麼問題

洛倫茲力產生的原因是什麼

什麼叫要素的需求曲線，什麼是需求曲線？

什麼叫蝸桿的特性係數,蝸桿的直徑係數問題

相關推薦