잡식성 논문 읽기/Frontiers

생산함수 추정문제 (미완성)

choijeo86 2021. 9. 22. 13:01

※ 이 글은 2년 전인 2019년에 쓰다 만 글인데 새 블로그에 옮겨둔다. 언젠가는 마무리 지어야지...(지어야...지...ㅠㅠ)

 이 블로그에 올라오는 글들 중 가장 'Nerdy'한 글이 될 것이다. 글을 이해하기 위해서는 학부고급~대학원 석사 수준의 미시경제학 및 계량경제학 지식이 필요하다.

이 글을 작성하는데는 아래 목차에 나온 논문 외에 Victor Aguirregabiria (U.Toronto), Holger Sieg (UPenn), 김규일 (MSU) 교수님들의 해당 주제 강의노트/슬라이드를 참고하였다. 물론 글에 있는 모든 오류는 필자의 책임이다. 

 이 글에 대한 모든 권리는 글쓴이에게 있으며 글에 남아있는 모든 오류는 글쓴이의 책임이다. 글의 영리적 이용을 금하며, 그 외 비영리적 목적에서의 이용은 글쓴이에게 문의해 주시기를 바란다. (소개는 상관없음.) 

수식입력은 MathJax을 활용하였다. 이를 위해 다음 글을 참조하였다. (Link)

===========================================================================

 

생산함수 추정 문제 (Production Function Estimation)

 

@choijeo86

 

목차

 

0. 들어가며

 

1. 생산함수 추정: 무엇이 문제인가.

1.1 동시성 문제

1.2 자기선택: 기업의 내생적 진입/퇴출 문제

 

2. 생산함수 추정 방법론의 연구흐름

2.1: 고전적인 연구 방법들 (도구변수, 패널고정효과, 패널GMM)

2.2: 비교적 최근의 연구들 (통제함수법)

2.2.1: Olley and Pakes (1996 Econometrica, 이하 OP1996)

2.2.2: Levinsohn and Petrin (2003 Review of Economics Studies, 이하 LP2003)

2.2.3. Wooldridge (2009 Economics Letters, 이하 W2009)

2.2.4: Ackerberg, Caves, Frazer (2015 Econometrica, 이하 ACF2015) 

2.2.4.1: Kim, Luo, Su (2019 Journal of Applied Econometrics, 이하 KLS2019)

2.3: 비교적 최근의 연구들 (그 밖에) - if possible

2.3.1: Gandhi, Navarro, Rivers (2020 Journal of Political Economy, 이하 GNR2020)  

 

3. 마크업 추정 (If possible)

3.1: De Loecker and Warzynski (2012 American Economic Review, 이하 DLW2012)

 

 

0. 들어가며

 

 

- 대학에서 경제학을 배울 때, 우리는 다음과 같은 내용들을 배우는 것으로 미시경제학의 기업 및 생산이론 부분을 시작한다.

 

- 가. 기업은 '노동(Labor: \(L\))'과 '자본(Capital: \(K\))'이라는 생산투입요소(Production Input)들을 사용해 어떤 생산품, 곧 '산출물(Output: \(Y\))'을 만들어낸다.

 

- 나. 그리고 이 때 생산투입요소인 \( (L,K) \)와 생산의 결과물인 \(Y\)간의 관계를 '생산함수(Production Function)'라고 부르고 흔히 \(Y=f(L,K)\) 이런 식으로 표현한다.

 

- 다. \(Y=f(L,K)\)는 좀 더 구체적인 함수 형태로 표현할 수 있는데, 가장 일반적으로 사용되는 함수는 콥-더글러스 함수(Cobb-Douglas function) 형태이다. 경제학자들이 콥-더글러스 함수를 사용해 온데에는 여러 이유가 있다. 여기서는 콥-더글러스 함수가 다른 종류의 함수들 (예컨대 선형함수나 레온티에프 함수)을 포괄하는 일반적인 형태의 생산함수라는 점, 그리고 미분 가능하기에 다루기 편리하다는 점(tractable) 정도만 언급한다. 우리는 앞으로 다음과 같은 콥-더글러스 함수 형태의 생산함수를 가정한다. 

 

\(Y=AL^{\beta_{l}}K^{\beta_{k}}\)

 

참고로 학부 중급미시경제학 교과서를 공부한 이라면, 위의 콥-더글러스 생산함수에서 모수(Parameter)인 \( \beta_{l}, \beta_{k}\)는 각각 노동과 자본에 대한 생산요소의 산출탄력성(Output Elasticity)가 된다는 것을 이해할 것이다.

 

- 라. 데이터에서 기업이나 공장이 어떤 \((L,K)\) 조합을 생산에 동원했을 때 어떤 \(Y\)가 생산되는 것이 관찰되었다고 하자. \((L,K)\) 조합과 \(Y\)간의 관계를 가장 잘 설명하는 생산함수의 모수값( \(\beta_{l}\), \(\beta_{k}\)은 무엇인가? 그리고 \(Y\)의 생산분 중 \(L\)과 \(K\)의 조합에 의해 설명되지 않는 부분(\(A\))은 얼마나 되는가? 

이러한 질문에 답하는 것이 바로 생산함수의 추정문제이다.   

 

- 라-1. 특히 두 번째 질문의 "\(Y\)의 생산분 중 \(L\)과 \(K\)로 설명되지 않는 부분(\(A\))"을 경제학에서는 '총요소생산성(Total Factor Productivity: TFP, 이하 생산성, Productivity로 통칭)'라고 불러왔다. 즉 생산성이란, 산출물 중 노동과 자본이라는 '보이는' 투입요소들에 의해 설명되지 않는 부분, 산출물에 대한 '보이지 않는 모든 생산요소들 (예컨대 기업 경영자의 경영능력 등)'의 기여분을 의미한다. 

 

- 결국 생산함수의 추정문제는 기업이나 공장의 생산공정에서 노동과 자본, 그리고 그 외의 부분들이 각각 얼마나 기여하는지, 그리고 그 기업의 생산이 얼마나 효율적인지를 측정하는데 중심적인 부분이 된다. 그렇기에 기업, 공장단위에서 생산함수를 '정확하게' 추정하는 문제는 산업조직론(Industrial Organization) 및 구조적 추정의 계량경제학(Structural Estimation)에서 중요한 부분을 차지해 왔고 앞으로도 그러할 것이다. 그 밖에 국제무역론에서는 세계무역구조(상품의 수출입, 오프쇼어링, 해외직접투자 등등)의 변화가 기업단위의 생산성에 어떻게 영향을 미치는지 관심을 가져왔기에, 생산성을 어떻게 추정해야 하는가의 문제는 국제무역론과도 밀접한 관련을 가질 수 밖에 없다.  

 

- 생산함수 추정문제에 대해 처음 접한 것은 박사 2년차의 구조적 추정방법론 수업에서였다. 그 때는 정말 아무것도 모르는 상태에서 수업에서 한두시간 듣고 '음, 잘 모르겠다... 이런 것들이 있구나... 긁적....'하고는 잊어버렸다. 참고로 수요함수 추정문제는 생산함수 추정문제 못지않게, 그 이상으로 어렵고 복잡하다. 더 나아가 경제주체간에 전략적인 행동을 하는 게임 상황을 가정하는 추정문제는....그만하자. 그리고 논문을 쓰다보니 이 문제가 상당히 중요한 문제임을, 그리고 내 연구와도 많이 연관된 문제임을 알게되었다. 이 문제가 경제학계에서 어느 정도로 중요한 문제인지 궁금하다면, 아래에 나열한 몇몇 논문들의 피인용수를 확인해 보기를 권한다. 

 

- 따라서 이 '길고 다소 지루할' 글에서는 생산함수 추정문제에 대해 내가 공부한 내용들을 정리해 볼 것이다. 생산함수 추정 문제에서 어떤 문제가 제기되어 왔고 이를 극복하기 위해 어떤 식의 방법들이 제시되었는지, 지나치게 깊고 엄밀하지도 않게, 그렇다고 너무 간단하지도 않게 정리하는 것이 글의 목표이다. 

 

 

1. 생산함수 추정: 무엇이 문제인가.

 

- 보다 구체적으로, 우리가 추정해야 할 생산함수를 적어보자. 먼저 우리가 가진 데이터는 기업(\(i\))의 연도(\(t\))별 패널데이터라고 가정하자. 따라서 이후 다룰 생산함수 추정에 관한 모든 연구는 '기업/공장 단위 패널데이터'에서의 생산성 추정 방법론에 관한 것들이다. 

 

기업(\(i\))의 연도(\(t\))의 콥-더글러스 형태 생산함수가 다음과 같다고 하자. 

 

\( Y_{it}=A_{it}L_{it}^{\beta_{l}}K_{it}^{\beta_{k}}\exp(\epsilon_{it})\)

 

여기서 \( \epsilon_{it}\)는 오차항(Error term)으로, 기업 단위별로 생산에 무관하게, 랜덤하게 주어지는 에러로 받아들이자. 좀 더 정확하게는, \( \epsilon_{it}\)는 기업 단위에서 생산요소를 고려했을 때 조건부 평균이 0이 되는 오차항으로 생각할 수 있다. 당장 쉽게 생각할 수 있는 오차항은 측정오차(Measurement Error) 같은 부분이다. 어이쿠 손이 미끄러졌네.

  

위 콥-더글러스 생산함수를 로그변환하면 다음과 같은 로그변환된 생산함수로 쓸 수 있다. (아래 식에서 소문자는 대문자의 로그변환이다. 즉 \( x=\log(X)\)

 

\( y_{it}= \beta_{l}l_{it}+\beta_{k}k_{it}+\alpha_{it}+\epsilon_{it}\)

 

위의 생산함수에서 연구자는 (\( y_{it},l_{it},k_{it})\)를 데이터로부터 볼 수 있는 반면, (\( \alpha_{it},\epsilon_{it})\)는 데이터로부터 볼 수 없는 부분이 된다.

 

우리가 생산함수의 산출탄력성 (\( \beta_{l},\beta_{k}\))를 정확하게 추정할 수 있으면, 우리는 또한 기업별 생산성 \( \alpha_{it}\)을 추정할 수 있게 된다. 즉 생산함수의 산출탄력성의 추정치를 (\( \hat{\beta_{l}},\hat{\beta_{k}}\))라고 하면, 기업별 생산성의 추정치 (\( \hat{\alpha}_{it}\))는 \( \hat{\alpha}_{it}=\hat{y}_{it}-\hat{\beta}_{l}l_{it}-\hat{\beta}_{k}k_{it}\)로 쓸 수 있다. 따라서, 위 식에서 생산성을 추정하는데 있어 관건은 생산함수의 산출탄력성을 정확히 추정하는데 있다. 

 

- 학부 계량경제학을 공부한 적이 있는 이라면, 위와 같은 선형 회귀식에서 관측불가능한 부분이 관측가능한 부분을 통제했을 때 조건부 평균적으로 독립이라면(Conditionally mean independent), 최소자승법(Ordinary Least Squares; OLS)으로 구한 (\( \hat{\beta_{l}},\hat{\beta_{k}}\)) 추정치는 편의(Bias)가 없는 추정량, 곧 '불편추정량(Unbiased Estimates)'이 된다는 것을 배웠을 것이다. 

위 식에서 우리가 관측 불가능한 부분은 \( \alpha_{it}+\epsilon_{it}\)이고, 우리는 \( \epsilon_{it}\)를 랜덤한 오차항으로 가정했다. 따라서 생산성 \( \alpha_{it}\)이 기업별로 랜덤하게 관측된다면, 최소자승법은 우리에게 가장 최선의 추정방법이 된다. 그리고 모든 문제는, 기업단위에서 관측되지 않는 생산성 \( \alpha_{it}\)이 랜덤하지 않다는데서 출발한다. 이를 계량경제학에서는 흔히 '내생성(Endogeneity)' 문제라고 부른다.

 

그렇다면 왜 \( \alpha_{it}\)는 랜덤하지 않게 되는가? 학부 계량경제학을 배운 이라면 어떤 경우 내생성 문제가 발생하는지 몇 가지 이유들을 배웠을 것이다. 이는 생산함수 추정문제에서도 비슷하게 적용할 수 있다.

 

1.1 동시성 (Simultaneity)

 

가장 생각하기 쉬운 문제는 기업이 생산요소를 얼마를 투입할지 결정하는 것인 생산성과 무관하지 않다는 것, 즉 수식으로는 \( cor(l_{it},\alpha_{it})\not=0\), \( cor(k_{it},\alpha_{it})\not=0\)라는 점이다. 예컨대 관측되지 않는 생산성이 높은 기업일수록 노동은 적게, 자본은 많이 투입하는 형태로 생산하는 경우를 상상할 수 있을 것이다. 이렇게 설명변수와 관측되지 않는 오차항 간에 영향을 주고 받을 수 있는 경우를 보통 동시성 문제가 있다고 부른다. 물론 이런 문제가 존재할 경우 \( \alpha_{it}\)는 랜덤하지 않다. (이러한 경우 OLS추정치의 편의(Bias)가 어떤 형태를 갖게 되는지에 대해서는 LP2003에 정리되어 있다.)

 

 

1.2 자기선택: 기업의 내생적 진입/퇴출 문제 (Self-Selection)

 

생산함수 추정에서 내생성에 관해 생각할 수 있는 다른 문제는 기업의 진입/퇴출에 관련된 문제이다. 우리가 관측하는 기업 데이터는 시장에서 활동 중인, 즉 해당 연도에 '살아 있는 기업들'만을 포함하고 있다. 실제의 데이터에서는 매년 새로운 기업이 시장에 진입(Entry)해 데이터에 들어오기도 하고, 작년에는 있던 기업이 나가기도(Exit) 한다. 그리고 물론 이러한 기업의 진입/퇴출은 랜덤하지 않다. 생산성이 높은 새로운 기업들은 시장에 남을 것이고, 반대로 생산성이 일정 수준 이하로 떨어진 기업들은 시장에서 버티지 못하고 나가게 된다. 

 

가장 간단하게, 우리 데이터에 단 두개의 기업만이 관찰되었다고 생각해보자. 기업1은 많은 자본을 투입한 큰 기업이고, 기업2는 적은 자본을 투입한 소규모 기업이다. 이 때 작은 기업 2가 데이터에서 '관찰'되었다는 뜻은, 이 기업은 (규모가 비슷한, 퇴출되었을 다른 소규모 기업들에 비해) 생산성이 아주 높은 기업임을 의미한다. 이러한 기업의 진입/퇴출에 있어서의 '자기 선택'문제를 고려하지 않고 추정할 경우, 우리는 자본을 크게 가진 기업은 생산성이 낮은 반면, 자본을 적게 가진 소규모 기업은 생산성이 높다는 식의 잘못된 결론을 얻게 될 것이다. 살아 남은 자가 강한 자이고 죽은 자는 말이 없다.

 

 

1.1과 1.2의 위의 두가지 문제중 우리는 1.2는 무시하고, 1.1만이 문제가 된다고 가정했을 때 어떻게 추정해야 하는지에 대해서만 집중해서 아래에서는 서술한다. 다만 이 글에서 1.2의 자기선택문제를 어떻게 다뤄야 하는지에 대해서는, 계량경제학에서 오래도록 많이 사용된 헤크만 방식의 수정(Heckman Correction) 방법과 비슷한 방법으로 OP1996에서 다뤘다는 것만 언급한다. 

 

 

2. 생산함수 추정 방법론의 연구흐름

2.1: 고전적인 연구 방법들 (도구변수, 패널고정효과, 패널GMM)

 

다시 학부 계량경제학으로 돌아가면, 내생성문제를 어떻게 완화시킬 수 있는지에 대해 몇가지 교과서적인 방법들을 배울 것이다. 적절한 도구변수(Instrumental Variable)를 찾는다, 패널데이터가 가용한 경우 내생성에 대한 일정한 가정 아래서 고정효과(Fixed Effects)/랜덤효과(Random Effects) 추정을 시도한다 등등. 생산함수 추정에 관한 연구의 다소 올드한 방법론들도 이러한 해법들로부터 출발하였다.

 

첫번째 방법은 적절한 도구변수(IV)를 활용하는 방법이다. 좋은 도구변수가 가져야 할 성질을 우리가 추정하고자 하는 위 생산함수 식의 추정과 연결지어 생각해보자. 우리의 도구변수는 설명변수(노동, 자본)와는 강한 상관성(Relevance)을 가지면서도, 관찰되지 않는 생산성 충격에는 무관하게 주어져야(Exogeneity) 한다. 이러한 변수를 찾는다면 이는 산출탄력성 추정을 위한 좋은 도구변수로 쓸 수 있다. 생산함수 추정을 위해 도구변수를 사용한 초기 연구들은, 생산요소의 가격(예컨대 노동의 가격인 임금율, 자본의 가격인 이자율)을 도구변수로 도입해 생산함수를 추정하는 것을 시도하였다.

그러나 이러한 방법은 여러 문제점들이 지적되었다. 첫째, 우선 기업단위별 생산요소 가격을 데이터에서 얻기가 어렵다. 둘째, 기업별로 생산요소를 사용하는데 있어 상이한(heterogeneous) 생산요소 가격을 연구자가 알 수 있어야 하는데 대부분 불가능하다. 셋째, 생산요소의 가격을 알 수 있더라도 이것이 과연 기업의 생산성 충격에 '외생적'으로 결정되는지 의심의 여지가 많다. 따라서 생산요소의 가격을 이용한 도구변수법은 그다지 좋은 방법이 아니다.

 

두번째 방법은 패널데이터의 고정효과추정법(Panel Fixed Effects Estimation)이다. 만약 우리가 관찰할 수 없는 생산성 충격 \( \alpha_{it}\)가 시간에 대해 불변이거나 (\( \alpha_{it}=\alpha_{i}\))적어도 시간에 대해 불변인 부분과 그렇지 않은 부분이 일정한 구조로 분해될 수 있다면(\( \alpha_{it}=\alpha_{i}+\delta_{t}+\epsilon^{*}_{it}\)), 패널데이터의 특성을 활용한 고정효과추정법(Within-Group estimator 또는 Fixed Effect estimator)은 우리에게 일관성 있는 추정치를 제공한다.

그러나 이 방법론도 심각한 문제를 몇가지 내포하고 있어서 최근에는 거의 사용되지 않는다. 첫째, 고정효과 추정을 사용한 탄력성 추정치는 대개 매우 작은 값을 결과로 내놓는 경우가 많은데, 이는 고정효과 추정을 위해 가정하는 외생적 설명변수의 가정이 실제 데이터와 잘 맞지 않기 때문이다. 둘째, 설명변수에 측정오차(Measurement Error)가 존재하는 경우 고정효과추정시 측정오차가 야기하는 추정치의 편의(Bias)문제를 더 악화시킬 개연성이 높다. 따라서 이 방법론도 최근에는 잘 쓰이지 않는다.

 

세번째 방법은 패널데이터의 동태적인 일반화된 적률추정법(Dynamic Panel GMM estimation)이라고 불리는 방법이다. 무슨 말인지 한글이 더 어렵다.(보통 경제학계에서는 이 방법론을 제안한 학자의 이름을 따서 아를라노-본드 추정법(Arellano-Bond estimator)으로 많이 알려져 있다.) 이는 두번째 방법인 고정효과추정법에서 문제가 되는 강한 가정을 개선하기 위해 추정하고자 하는 식을 패널데이터에서 일계 차분(First Difference)한 뒤, 설명변수의 과거값(Lagged explanatory variable)을 도구변수로 삼아 GMM 추정하는 방법이다. 즉 아를라노-본드 추정치는 1계차분-GMM추정치로 이해할 수 있으며, 두번째의 고정효과 방법론 또한 세번째 방법의 한가지 특수한 경우로 이해하는 것이 가능하다. (참고로 패널데이터 계량경제학을 약간 배웠다면, 패널데이터에서 일계차분한뒤 최소자승법으로 얻은 추정치, 곧 일계차분추정치(First-Differenced estimator)는 위 두번째 방법의 고정효과 추정법(Within Group Estimator 또는 Fixed Effect Estimator)과 점근적으로 같은 추정치를 반환한다는 것을 알 것이다.) 하지만 이러한 아를라노-본드 추정법의 경우, 일계차분한 설명변수와 도구변수로 쓰일 차분 전 설명변수의 과거값 간의 낮은 상관관계로 인한 "약한 도구변수 문제(Weak Instrument problem)"가 약점으로 지적되어, 역시 최근에는 그다지 쓰이지 않는다. 

 

이 소절에서는 생산함수 추정에 대한 고전적인 방법론을 아주 간단하게 리뷰하였다. 각 문단의 끝에 적었듯, 이 고전적인 세 가지 방법론들은 데이터와 추정방법론의 발달로 인해 더 이상 잘 쓰이지 않는 방법들이다. 생산함수 추정에서 최근에 주로 사용하는 방법들은 소위 통제함수를 사용한 방법론(Control Function Approach)으로, 다음 절의 첫 연구인 Olley and Pakes (1996 Econometrica)로부터 출발한다. 

 

 

2.2: 비교적 최근의 연구들 (통제함수법)

2.2.1: Olley and Pakes (1996 Econometrica, 이하 OP1996 Link)

 

논의를 진행하기에 앞서, 우리가 추정해야 하는 생산함수식을 다시 한 번 써보자. 

 

\( y_{it}= \beta_{l}l_{it}+\beta_{k}k_{it}+\alpha_{it}+\epsilon_{it}\)

 

계량경제학에서 통제함수법(Control Function Approach)의 요체는, 위의 관측불가능한 내생적인 변수 \( \alpha_{it}\)를 다른 관찰가능한 대리변수(Proxy variable)를 사용해 적절하게 통제하는데 있다. 만약 우리가 관찰불가능한 \( \alpha_{it}\)를, 관찰가능한 다른 대리변수로 적절하게 통제할 수 있다면 위의 식에서 우리가 추정해야 하는 탄력성을 추정하는데 걸림돌인 '관측불가능한 내생성 문제'가 사라진다. 이러한 통제함수에 기반한 추정법은 생산함수추정의 최근 연구에서 주된 추정방법으로 활용되어 왔다. 

 

통제함수를 이용한 생산함수추정의 연구흐름에서 가장 중요한 시작은 Olley and Pakes (1996 Econometrica, 이하 OP1996)이다. OP1996은 관찰불가능한 생산성 충격 \( \alpha_{it}\)을 대리하는 변수로 기업의 '투자(investment)'를 제시했고, 이러한 방법이 기업단위 생산함수의 탄력성을 합리적으로 추정해냄을 밝혔다. 

 

OP1996의 추정절차는 크게 2단계로, Step1에서는 \(\beta_{l}\)을, Step2에서는 \(\beta_{k}\)를 추정한다. 

이 두 단계의 추정방법을 서술하기에 앞서, OP1996의 추정법을 뒷받침하는 몇가지 가정들을 여기서 간단하게 서술한다. 

 

- 가정1. 기업단위의 투자함수를 다음과 같이 적을 수 있다.

 

\( i_{it}= f_{k}(k_{it},\alpha_{it})\)

 

즉 기업의 투자는 해당기의 자본, 그리고 기업단위 생산성에 따라 결정된다. (OP1996의 원논문에서는 투자함수는 이전 기의 노동에도 의존하게 되어 있지만 이 글에서는 더 단순하게 가정하였고, 이는 논의에 큰 영향을 주지 않는다.) 

- 가정2. 위 기업단위 투자함수는 생산성(\( \alpha_{it}\))에 대해 가역(invertible)이다.

- 가정3. 생산성충격\( \alpha_{it}\)은 마르코프 확률과정을 따른다. 즉 \( \alpha_{it}=g(\alpha_{it-1})+\xi_{it}\)와 같이 표현할 수 있다. (\( \xi\)는 랜덤 오차항). 보다 구체적으로, 예컨대 AR1확률과정(\( \alpha_{it}=\rho\alpha_{it-1}+\xi_{it}\) ( \(0<\rho<1 \)))을 가정할 수 있다. 

 

위와 같은 가정하에서, 가정1과 2에 의해 기업단위 생산성 충격은 다음과 같이 투자함수의 역함수로 표현될 수 있다.

 

\( \alpha_{it}= f_{k}^{-1}(k_{it},i_{it})\)

 

즉, 보이지 않는 생산성충격은, 보이는 자본과 투자의 함수로 표현되게 된다. 위의 함수관계를 보이지 않는 생산성충격에 대한 통제함수(Control Function)라고 부른다. 위 통제함수를 우리의 원 추정식에 대입해 보자. 

 

\( y_{it}= \beta_{l}l_{it}+\beta_{k}k_{it}+ f_{k}^{-1}(k_{it},i_{it})+\epsilon_{it}\)

 

위 식에서 \( (y_{it},l_{it},k_{it},i_{it})\)는 모두 관찰가능한 변수들이고, 위 식에서 관찰되지 않는 부분은 랜덤한 오차항인 \( \epsilon_{it}\) 뿐이다. 

 

먼저 위의 식을 OLS로 추정할 시 우리는 \( \beta_{l}\)에 대해서는 바람직한 추정치를 얻을 수 있다. (즉 \( \beta_{l}\)은 식별가능하다.) 단 자본(\(k_{it}\))는 우변의 두번째와 세번째(통제함수)에 모두 포함되는 변수이므로, \( \beta_{k}\)는 위 식의 OLS로부터 식별할 수 없다. 위 식의 OLS추정으로부터 우리가 식별할 수 있는 부분은 \( \beta_{l}l_{it}\)과 나머지 부분인 \( \phi_{it}=\beta_{k}k_{it}+\alpha_{it}=\beta_{k}k_{it}+f_{k}^{-1}(k_{it},i_{it})\)이다. 

 

OP1996의 첫 절차는 다음과 같다.

 

Step 1. 통제함수를 포함한 생산함수식의 OLS추정으로부터 노동의 산출탄력성 \( \hat{\beta_{l}}\)과 자본, 투자에 관한 부분인 \(\phi_{it}=\beta_{k}k_{it}+f_{k}^{-1}(k_{it},i_{it})\)의 추정치 \(\hat{\phi}_{it}\)를 얻는다. 

 

따라서 우리는, 우리가 얻어야 할 산출물탄력성 추정치 (\( \hat{\beta}_{l},\hat{\beta}_{k}\)) 중 Step 1로부터 노동에 관한 탄력성(\( \hat{\beta}_{l}\))를 얻었다. 두번째 절차는 나머지 자본의 산출물탄력성(\( \hat{\beta}_{k}\))을 얻는 과정에 관한 것이다.

 

Step 2. Step 1로부터 우리는 \( \phi_{it}=\beta_{k}k_{it}+\alpha_{it}=\beta_{k}k_{it}+f_{k}^{-1}(k_{it},i_{it})\)의 추정치 \(\hat{\phi}_{it}\)를 얻었다. 생산성충격 \( \alpha_{it}\)가 마르코프 확률과정을 따른다는 가정3에 따라 \( \phi_{it}\)는 다음과 같이 다시 쓸 수 있다. 

 

\( \phi_{it}=\beta_{k}k_{it}+\alpha_{it}=\beta_{k}k_{it}+g(\alpha_{it-1})+\xi_{it}\)

\( \phi_{it}=\beta_{k}k_{it}+g(\phi_{it-1}-\beta_{k}k_{it-1})+\xi_{it}\)

 

두번째 줄의 표현으로부터, 우리는 \( \phi_{it}\)가 (\( k_{it},\phi_{it-1},k_{it-1}\)) 로 표현될 수 있음을, 그리고 이들은 모두 관찰가능함을 확인했다. (물론 \( \phi_{it}\)와 \( \phi_{it-1}\)는 Step 1에서 얻은 추정치를 사용한다.) 

실제 추정에서는 기업의 투자결정 시점에 대한 가정으로부터 얻은 적률조건들(Moment Conditions)을 활용, 일반화된 적률추정법(GMM)을 사용해 \( \beta_{k}\)의 추정치 \( \hat{\beta}_{k}\)을 얻게 된다. 보다 구체적으로 GMM추정을 위한 적률조건들은 다음과 같이 쓸 수 있다.

 

\( E(\epsilon_{it}|I_{it-1})=E(\xi_{it}|I_{it-1})=0\)

 

여기서 \( I_{it-1}\)는 기업 \( i\)가 시점 \( t-1\)에 갖고 있는 정보들의 집합(Information set)으로, \( \{k_{it},i_{it-1}\} \in I_{it-1}\)이다.

 

2.2.2: Levinsohn and Petrin (2003 Review of Economics Studies, 이하 LP2003 Link)

 

위의 OP1996 방법의 가장 큰 기여는, 이전의 추정방법론에 비해 비교적 받아들이기 쉬운 가정들 하에서 생산성을 추정하는 합리적인 절차를 제시했다는데 있다. 기업의 투자가 자본과 생산성의 함수라는 가정, 그리고 투자와 생산성간에는 일정한 단조적 관계가 있어서 투자함수가 가역이라는 가정은 아주 받아들이기 힘든 가정이라고 보이지는 않는다. 그리고 생산성이 시간에 따라 상관관계(Serially correlated)를 가지며 마르코프 확률과정으로 표현될 수 있다는 가정 또한 크게 무리가 없어 보인다.

 

그러나 실제 데이터를 활용한 추정에서 문제가 되는 부분은, 투자와 생산성간의 관계에 기반한 투자함수의 가역성(Invertibility)이 위배되는 경우가 적잖다는데 있다. 실제 기업데이터에서 상당수의 기업들은 자신들의 투자가 없었다고(즉 \( i_{it}=0\)) 보고하거나 혹은 아예 관측치가 없는 경우도 적지 않다. 이는 실제로 투자가 이뤄지지 않았거나, 투자가 이뤄지더라도 투자결정으로부터 실제 투자가 이뤄지는데까지의 조정비용등의 존재로 인한 문제일 가능성이 크다. (이쪽 논문들에서는 이를 기업의 투자가 'lumpy'하는데서 오는 문제라고 표현한다.) 그리고 이러한 경우가 전체 데이터에서 차지하는 비중이 커질수록, 투자함수의 가역성에 기반한 OP1996을 사용한 추정치를 신뢰하기가 어려워진다는 문제가 생긴다. 

 

이러한 문제에 대해 Levinsohn and Petrin (2003 REStudies, 이하 LP2003)에서는 기업단위 생산성의 통제함수로 '투자'변수 대신 기업의 중간재 투입물(Intermediate Materials Input: \( m_{it}\))을 통제함수로 사용할 것을 제안하였다. 투자에 비해 중간재 투입 변수는 기업 데이터에서 의미있는 관측치가 더 잘 관찰된다는 점에서, 투자에 비해 더 좋은 생산성의 통제함수로 활용될 수 있다. 

LP2003에서 기업의 중간재 투입에 대한 함수는 OP1996에서의 투자함수와 같이 현재기의 자본과 생산성의 함수, 즉 \( m_{it}=m(k_{it},\alpha_{it})\)로 표현할 수 있다. 이러한 가정 아래서 LP2003은 OP1996과 거의 동일한 가정과 2단계 절차에 기반해 산출물탄력성을 추정할 것을 제안하고 있으며, 실제 칠레의 공장데이터를 사용해 자신들의 추정치가 OP1996의 추정치에 비해 더 실제값에 가까울 수 있음을 입증했다. LP2003의 가정과 추정절차는 OP1996과 큰 틀에서 거의 흡사하다.

 

2.2.3. Wooldridge (2009 Economics Letters, 이하 W2009 Link)

2.2.4: Ackerberg, Caves, Frazer (2015 Econometrica, 이하 ACF2015 Link

2.2.4.1: Kim, Luo, Su (2019 Journal of Applied Econometrics, 이하 KLS2019 Link)

2.3: 비교적 최근의 연구들 (그 밖에) - if possible

2.3.1: Gandhi, Navarro, Rivers (2020 Journal of Political Economy, 이하 GNR2020 Link)  

 

3. 마크업 추정 (If possible)

3.1: De Loecker and Warzynski (2012 American Economic Review, 이하 DLW2012 Link)


다시 학부 중급 미시경제학 시간으로 돌아가보자. 미시경제학의 생산자이론에서 배우는 중요한 가르침 중 하나는 '시장의 기업들은 자신들의 이윤을 극대화하도록 행동한다'라는 것이다. 교과서에 있는대로, 기업들의 이윤함수를 다음과 같이 정의하자. 

 

\( \pi(q) = p(q)q-TC(q) \) 

 

이러한 이윤함수에서 이윤극대화조건은 \( MR(q) = MC(q) \) 이다. 즉 기업들은 그들의 한계수입(MR)이 한계비용(MC)과 같아지도록 그들의 생산량을 정한다. 

 

- 1. 시장이 완전경쟁시장이라면 (즉 시장에는 동질적인 재화만 존재하며 각 기업들은 완전한 정보를 갖고, 동시에 각 기업들의 진입/퇴출에 장애가 없다면), 각 기업들은 가격수용자(Price Taker)로 행동한다 \( (p(q) = p) \). 이러한 시장에서는 다음의 두 조건이 항상 성립해야 한다. 

 

1) 이윤극대화 조건 \( MR(q)= MC(q) \)  2) 영이윤조건 \(p = AC(q) \)

 

그리고 완전경쟁시장에서 \( p = MR(q) \)이므로, 모두를 합치면, \(p = MR(q) = MC(q) = AC(q)\)이 된다. 

 

- 2. 그러나 시장이 독점적 경쟁시장이라면, 즉 시장에서 각 기업들은 차별화된 재화를 생산하며 각 기업들이 자신들이 생산하는 재화에 대해 독점력을 갖는다면, 그리고 이 독점력으로부터 0보다 큰 경제적이윤을 누릴 수 있다. 이러한 시장에서 이윤극대화 조건은 \( p(q)>MR(q)=MC(q) \) 로 쓸 수 있다. 기업들은 한계비용보다 높은 수준에서 자신들의 상품 가격을 결정할 수 있고, 0보다 큰 이윤을 얻는다. 왜? 독점력을 가지니까.

 

위에서 보듯 시장이 독점적 경쟁의 특성을 갖는다면, 각 기업들은 일정한 시장지배력을 가진다. 그렇다면 이 시장지배력은 어떻게 측정할 수 있는가? 경제학자들은 이를 측정하기 위해 '마크업(Markup)'이라는 개념을 사용해 왔다. 마크업\( (\mu) \)은 보통 가격과 한계비용의 비율로 정의된다. 

 

\( \mu = \frac{p}{MC} \)

 

즉 마크업은 가격과 한계비용간의 간격(wedge)로 생각할 수 있다. 완전경쟁시장에서는 마크업이 항상 1인 반면, 독점적경쟁시장에서는 마크업이 1보다 크게 된다. 기업의 시장지배력이 클수록 마크업이 클 것이라는 것도 쉽게 알 수 있다. 마크업이라는 단어를 학부 미시경제학에서 들을 일은 거의 없지만, 사실 위와 같은 이윤극대화 문제에서 자연스럽게 생각할 수 있는 개념이다. 그리고 수업시간에 배운적은 없지만 기업과 관련된 경제학 연구에서 아주 흔히 등장하는 개념 중 하나이다. 

 

이제 실증분석을 생각해보자. 마크업에 관해 가장 심각한 문제는, 데이터에서 마크업을 직접 볼 수 없다는 점이다. 아주 좋은, 거의 모든 정보를 갖고 있는 데이터가 있다면 기업 단위에서 상품 가격\( (p) \)은 볼 수 있을 것이다. 그런 데이터도 사실 매우 드물다.그런 데이터가 있어도 너는 못 본다.  그러나 아무리 좋은 데이터가 있더라도, 한계비용\( (MC) \)은 우리가 알 수 없다. 어떤 기업의 생산에 있어 한계비용은 얼마인가? 모른다.

 

결국 우리는 뭔가 '간접적인' 방법으로 마크업을 '추정'하는 방법을 생각해야 한다. "어떻게 마크업을 추정할 것인가?"에 대한 설득력 있는 방법을 하나 제안한 것이 DLW2012의 주된 연구업적이다. 핵심은, 가격-한계비용의 비율로 정의되는 마크업이, 특정 생산요소에 대해 그 산출탄력성(Output Elasticity)과 그 생산요소에 대한 투입비용-수입간의 비율(Ratio of Expenditure on input to Revenue)간의 비율로 달리 표현될 수 있음을 보이고, 이를 실제 데이터에서 추정한 것이다. 즉 DLW2012에 따르면, 마크업은 어떤 생산요소\( (j) \)에 대해 다음과 같이 표현할 수 있다.   

 

\( \mu = \frac{p}{MC} = \frac{\text{elasticity}_{j}}{\big(\frac{p_{j}x_{j}}{pq}\big)} \)

 

이제 어떤 논리에 따라 마크업을 이렇게 쓸 수 있는지 알아보자.

 

기업들의 생산비용 최소화 (Cost Minimization) 문제를 생각해보자.  기업들은 상품들을 생산하기 위해 생산요소 \(j = 1 ... J \)를  사용하며, 그 가격과 생산요소 투입량을 각각 \( (p_{j}, x_{j}) \) 로 쓰자. 어떤 기업이 생산량 \( \bar{q}=q(x_{1},...x_{J}) \)을 달성하는데 생산비용을 최소화 하려 한다. 이러한 비용최소화 문제는 아래와 같이 쓸 수 있다. (참고로 기업들의 생산비용극소화 문제는 사실 이윤극대화 문제와 같은 해를 갖는 문제라는 것은 학부 고급미시경제학에서 배울 것이다.)

 

\( min \sum_{j=1}^{J} p_{j}x_{j} ~~~~~\text{s.t.}~~~~~q(x_{1},...x_{J})=\bar{q}\)

 

위 문제는 등식제약하에서의 선형최적화 문제이므로, 다음과 같은 라그랑지 문제로 달리 쓸 수 있다.

 

\( \mathcal{L}(x_{1},...x_{J},\lambda ) = \sum_{j}^{J} p_{j}x_{j} +\lambda(q(x_{1},...,x_{J})-\bar{q})\)

 

이 때 라그랑지 승수 \( (\lambda) \)는 \( \lambda = \frac{\partial \mathcal{L}}{\partial q}  = \frac{\partial TC}{\partial q} \)로, 한계비용과 같다. 위와 같은 라그랑지 문제에서 최적해가 충족시켜야 하는 일계조건(First-order condition)은 다음과 같다. 

 

For any \(j\), \( p_{j} = - \lambda \frac{\partial q}{\partial x_{j}}\)