부트스트래핑과절단회귀 (truncated regression) 를이용한과수농가의기술효율성분석 이명헌 황수철 부트스트래핑과절단회귀 (truncated regression) 를이용한과수농가의기술효율성분석 * -Tobit 모형 (censored regression) 과의비교 - The Technical Efficiency Analysis using Bootstrapping and the Truncated Regression -A Comparision with Tobit Model(censored regression)- 이명헌 ** 황수철 *** 1) Lee, Myung-Heon Hwang, Su-Chul 목 차 ABSTRACT Ⅰ. 서론 Ⅱ. 이론적논의 Ⅲ. 분석자료 Ⅳ. 분석결과 Ⅴ. 요약및결론참고문헌 ABSTRACT This paper analyzes the effect of the land size and the family labor hours on the technical efficiencies of Korean fruit (apple, pear, grape, and peach) farms which are measured with Data Envelopment Analysis. It follows the estimation method suggested by Simar and Wilson(2007) by using truncated regression, (instead of the censored regression * 본논문은농촌진흥청연구사업 ( 과제번호 PJ011394) 의지원에의해이루어진것임. ** 인천대학교경제학과교수 *** 농정연구센터소장 67
第 32 卷第 3 號 2015 年 9 月 model which are prevalent in the empirical works) and bootstrapping, in order to adjust for the bias of the simple DEA and to estimate the confidence interval of the estimates, taking into account the serial correlation of the error terms and their correlation with the explanatory variables which are intrinsic to DEA estimates. The estimation results show that the family labor hours enhance the technical efficiency of grape growing. They also suggest that the choice between the censored regression and the truncated regression model may have important consequence on the estimation results. Key Words DEA, bootstrapping, truncated regression, fruit, technical efficiency Ⅰ. 서론 농업경영에서기술적효율성 ( 물질적생산성 ) 의제고는배분적효율성 ( 시장가격에대응한적절한생산물조합및투입물조합의선택 ) 과더불어소득증대의관건이되는중요문제이다. 따라서농가의기술적효율성을파악하고농가사이의효율성차이요인을분석한많은연구가이뤄졌다. 특히, 비모수적방법인자료분석포락법 (Data Envelopment Analysis:DEA) 은의사결정단위의효율성을평가하는기법으로널리이용되고있다. 이방법의장점은, 투입과산출사이의특정한함수형태를가정하는방식에비해훨씬일반적가정으로개별농가의효율성을비교할수있다는점이다. 또한, DEA를통해개별농가들의효율성지수를계측하면, 그지수들에어떤요인 [ 이른바 환경변수 (environment variable) ] 들이영향을미치는지계량경제학적방법으로분석하는것도가능하다. 이러한분석방법을효율성결정요인분석이라할수있다. 우리나라에서도기존의여러연구들이농업분야의효율성결정요인분석을시도했다. 2000년이후의연구들을살펴보면, 이순석 김충실 이상호 (2001) 는경북지역의자료를이용하여사과환경농업의효율성결정요인을분석하였고, 이순석 조성주 정호근 (2003) 은콩생산의효율성결정요인을분석하였다. 한편, 권오상 김한호 (2009) 는산지유통센터의효율성을, 이상호 (2010) 는농업유통법인의효율성을분석하였다. 68
부트스트래핑과절단회귀 (truncated regression) 를이용한과수농가의기술효율성분석 이명헌 황수철 이연구들이이용한방법론은, 기본적으로 Simar and Wilson(2007) 의논문에언급된약 50 여편에이르는국외논문들 (Simar and Wilson, 2007:32) 에서사용된방법론 (Ⅱ장에서후술 ) 과같다. 그런데 Simar and Wilson(2007) 은그들이검토한연구들이, 이용한자료를발생시키는확률적과정에대한명시적이고정확한논의가없다는점을지적하면서, 설득력있는확률적과정을제시한후, 그틀에입각하여기존연구들의문제점을지적하였다. 그들이지적한문제는크게세가지로정리된다. 첫째, DEA를통해서얻어진효율성지표는대표본에서일치성을갖지만소표본에서는편의 ( 偏倚 bias) 를가진다. 즉, 측정오차 (measurement error) 의문제가있다. 둘째, DEA에서얻어진효율성지표는일치성을갖지만, 그수렴의속도가느려서, 그변수를이용한함수추정의결과로얻어진추정치의분산과공분산은통상적인방법으로추정할수없으며, 따라서그에입각한통계적추정은정확하지못하다. 셋째, 환경변수들이효율성지표에주는영향을모형화하기위해대부분 Tobit 모형을사용하는데여기에도개념적인문제가있다. 이상과같은문제를해결하기위해서 Simar and Wilson(2007) 은 DEA에부트스트래핑기법을결합하여회귀분석의효율성을높이고, 추정치에대한가설검정을정확히할수있는방법을제시하였다. 이논문은그들의방법을농촌진흥청의과수소득자료중사과, 배, 포도, 복숭아 4개품목에적용하여물질적농업생산성에경지규모와가족노동력투입이미치는영향을평가하고자한다. 과수부문은 1990년대에전체농업성장의 12% 를기여하고있었으나, 2000 2011년에는농업성장기여도가 -44.1% 로하락하였다 ( 황수철외, 2014). 특히칠레, 미국, EU, 캐나다, 중국과의 FTA 체결로인해수입개방이가속화하면서경쟁력강화의필요에직면하고있는대표적농산물부문이라할수있다. 이러한상황에서주요과수품목의기술적효율성결정요인을분석하는것은, 개별농가나정책당국이경쟁력강화를위한대응방향을찾는데도움을줄수있을것으로기대된다. 분석의대상이된 4개품목은재배면적, 생산량, 생산액측면에서우리나라과수산업의절반을차지하고, 소비량측면에서도 40% 의점유율을차지하고있어우리나라과수중가장중요한품목들이라고할수있다. 1) 1) 중요성품목에서이 4 개품목에필적하는품목으로감귤을들수있으나그재배지역이제주도로국한되어있다. 69
第 32 卷第 3 號 2015 年 9 月 < 표 1> 과수품목의재배면적, 생산량, 생산액, 1인당소비량 (2013년) 재배면적 ( 천ha) 생산량 ( 천톤 ) 생산액 (10억원 ) 1인당소비량 (kg) 전체 161 2,523 4,114 63.2 사과 30 494 1,058 9.8 배 14 282 314 5.2 포도 17 260 517 6.3 복숭아 15 193 280 3.8 4개품목비율 (%) 47.2 48.7 52.7 39.7 자료 : 농림축산식품부, 2014. 국내에서 DEA를이용하여과수재배의효율성을측정한연구들은적지않지만, 효율성의결정요인을회귀분석의틀을이용하여분석한연구는앞에서언급한이순석 김충실 이상호 (2001) 를제외하면찾기어렵다. 우수곤외 (2002) 는배재배농가를영농조합참여여부및참여영농조합의유형에따라서구분하여효율성지표의평균을단순비교하는방식을취하였다. 송경환 (2010) 은나주배농가에대해서효율성지표들을계산하였으나효율성에영향을주는요인들에대한분석을시도하지는않았다. 한재환외 (2013) 는다른비과수작목과더불어사과와배재배농가의효율성을분석하였는데경영비규모 4분위별그리고광역시도별효율성지표를비교하는방식을취하였다. 문한필외 (2014) 는한 칠레 FTA 대책이과수농가생산성과효율성에미친영향을분석하였지만정부정책이시행된지역과그렇지않은지역의각종지표의평균을비교하는방식을취하였다. 이연구에서는효율성에영향을미치는환경변수로는경지규모와가족노동력을이용한다. 이들변수들은그자체가투입변수라고볼수도있으나, 다른투입요소에비해서는고정적성격이강하므로환경변수로간주하였다. 향후소득자료와더불어환경변수적요인이강한변수들 ( 예컨대경영주의연령, 교육수준, 지도서비스이용접근성등 ) 에관한정보가추가적으로파악된다면, 이논문에서제시한방법론을확대 적용할수있을것이다. 2) 2) 이순석외 (2001) 의연구에서는환경변수로경지면적이외에도본원적환경변수라고할수있는경영주학력, 가족원수, 영농경력등을사용하여이들이효율성에미치는영향을분석하였다. 단, 이들의연구는경북지역친환경사과농가 48 호의자료만을사용하였으므로전국적대표성이다소부족하였고, 앞에서언급한방법론상의한계도가지고있었다. 70
부트스트래핑과절단회귀 (truncated regression) 를이용한과수농가의기술효율성분석 이명헌 황수철 Ⅱ. 이론적논의 먼저 DEA의개념과기존의많은문헌들이행하고있는효율성결정요인분석방식, 그리고그방식의문제점에관한 Simar and Wilson(2007) 의논의를요약한다. DEA는생산가능집합 만큼의투입으로 만큼의산출이생산가능 } ( 와 는각각 차원및 차원비음 ( 非陰 ) 벡터 ) 에속하는특정한점들이생산변경으로부터얼마나떨어져있는지를하나의지수 ( 이하 역 ( 逆 ) 효율성지수 라함 ) 로나타내는비모수적방법이다. 예를들어 의특정원소 산출기준역효율성지수는, sup 으로정의된다 (Simar and Wilson, 2007:34). 현실에서는 나생산변경에대한완벽한정보는구할수없고 의일부원소로구성된표본 을얻을수있을뿐이다. 여기에포함된특정원소 ( ) 의투입기준역효율성지수에대한추정량 는스칼라로서, 다음과같은최대화문제의해로정의된다 (Simar and Wilson, 2007:37). 이와같은산출기준역효율성지수는정의상 1보다작을수는없으며, 그값이커질수록해당단위의효율성이 낮음 을의미한다. 3) 의원소는비음, (1) 단, 차원벡터, 차원의 1 을원소로갖는벡터 보통 DEA를이용한효율성분석은다음과같은방식으로진행된다 (Simar and Wilson, 2007, pp.37 38). 우선개념적으로효율성과환경변수사이의관계가다음과같다고가정한다. (2) 여기서, : 역효율성지수, : 계수, : 환경변수, : 확률변수 ( 구체적분포에대해서는아래의논의참조 ) 3) 투입기준 DEA 분석에서는효율성지표가정의상 0 이상이고 1 이하인숫자로이하로나타나고그값이클수록효율적이지만, 산출기준 DEA 분석에서는역효율성지표가측정되고, 이역효율성지표는정의상 1 이상이며, 그값이작을수록효율적이다. 이정동 오동현 (2012) 3 장및 4 장참조. 71
第 32 卷第 3 號 2015 年 9 月 구체적추정을위해서는 1단계에서는표본데이터에 DEA를적용하여각표본단위 에대해서 의추정량 를구한다. 2단계에서는위의회귀식에 OLS나 Tobit 모형을적용하여최우추정법으로 의추정량 를구한다. 국내의 2000년이후농업분야효율성분석연구들도 < 표 2> 에서보는바와같이위에서설명한틀을따르고있다. < 표 2> 국내농업분야효율성분석연구방법비교 품목 효율성지수 모형 신뢰구간추정방법 이순석외 (2001) 친환경사과 단순 DEA 결과 Tobit 최우추정결과 이순석외 (2003) 콩 단순 DEA 결과 Tobit 최우추정결과 권오상외 (2009) 산지유통센터 부트스트래핑 DEA 결과 Tobit* 최우추정결과 이상호 (2010) 유통법인 단순 DEA 결과 Tobit 최우추정결과 *DEA 값의최소값을제한점 (censoring point) 으로함. 이같은추정방식이가지는문제는 Simar and Wilson(2007:37 39) 에자세히설명되어있으므로이하에서는이를간단히요약한다. 첫째, 단순한 DEA로추정된표본단위의역효율성값은하방편의 (downward biased) 되어있다. 즉, 효율성을실제보다과장하여보여준다. 이것은직관적으로이해가능하다. 진정한역효율성값은생산가능집합의변경을정확히알때계산가능하다. 그런데, 표본에는항상변경이내의점들만이부분적으로포함되므로, 표본에포함된단위들의효율성은실제보다과장될수밖에없다. 이문제를해결하는것은부트스트래핑을통해서 ( 진정한역효율성값자체를직접추정하는것이아니라 ) 진정한값과 DEA 결과사이의편의를추정하는것이다. 이렇게추정된편의를조정해줌으로써추정량의통계적효율성을높일수있다. 4) 둘째, 식 (2) 를가정하고추정하려할때진정한 가아니라 DEA로부터추정된값 을이용하게되는데이때교란항계열 ( ) 은계열상관 (serial correlation) 을가진다. 5) 또 4) 편의를조정하는구체적인방법은아래의설명을, 그리고이론적배경은 Simar and Wilson(1998) 과 Simar and Wilson(2000) 을참조하라. 5) DEA를통해개별단위의효율성지수를계산할때, 표본의모든값이그값에영향을주기때문이다 (Simar and Wilson, 2007:39). 72
부트스트래핑과절단회귀 (truncated regression) 를이용한과수농가의기술효율성분석 이명헌 황수철 한환경요인변수와교란항도상관관계를가지게된다. 6) 그때문에통상적인방식으로계산된추정계수의공분산행렬은정확하지않게된다. 이문제를해결하기위해서 Simar and Wilson은역시부트스트래핑을통해서추정계수의신뢰구간을추정할것을제안하였다. 셋째, 통상적으로 DEA를설명하는회귀방정식을 censored regression 모형의일종인 Tobit 모형으로추정하는데, 이것은표본중의상당수가하한값 ( 즉, 1) 을갖는경우가있다는이유로정당화된다. 그러나 Simar and Wilson(2007) 에따르면, 이것은, 논리적근거없이, 역효율성척도가 1인다른표본의경우와다른우도 (likelihood) 를부여하는것으로타당성이약하며, truncated regression 모형을사용하는것이더적절하다. 이점을이해하기위해서는두모형의우도함수를비교하는것이도움이된다 (Simar and Wilson, 2007:58 59). 표본에따른 Tobit 모형추정을위한우도함수는다음과같다. (3) 이 censored regression 모형은역효율성지수를결정하는확률적과정에서 1보다작은값도생성될수있지만, 1보다작은값이형성된경우에는그것이모두 1로관측된다고가정한다. 따라서역효율성이 1이되는관측치에는다른관측치와는질적으로다른우도 [ 즉밀도 (density) 가아닌확률 (possibility mass)] 가배정된다. 반면, Simar and Wilson(2007) 은개념적으로위와같은 censored regression보다아래와같은 truncated regression을사용하는것이더적절하다고본다. (4) 이 truncated regression 모형에서는 1 미만의값이실현될가능성이원천적으로배제되며, 1에대해서도다른값의경우와같이확률밀도 (density) 가배정된다. 즉, Simar and Wilson (2007) 은역효율성이 1 로관측된값에다른관측값과다른우도를부여할적절한근거가없 6) Simar and Wilson(2007:39). 73
第 32 卷第 3 號 2015 年 9 月 다고보고 truncated regression이더적합하다고보고있는것이다. 이와같이 censored regression 모형의비적합성을주장하는그들의논의는 censored regression이전제로하는상황을고려하면타당성이있는것으로보인다. 즉, 역효율성지수가실제로 1보다더낮은값을갖는상황은그정의상불가능하다고보는것이, 역효율성지수가 실제로 1보다낮은경우도있는데, 그값이다만 1로관측될뿐이다 라고보는것보다합리적이기때문이다. 특히뒤에서보듯이 DEA 관측치를부트스트래핑으로보정하여역효율성지수가 1인관측치가없게되는상황에서는더욱그들의주장이타당성을가지는것으로보인다. 이상과같은기존모형들의문제점을해결하기위해서 Simar and Wilson(2007) 이제시한추정방법은다음과같이요약할수있다 (Simar and Wilson, 2007:42 43). 1단계 : 통상적 DEA로각표본에대해서역효율성지표 를계산한다. 2단계 :1단계에서계산된값을피설명변수로하고환경변수를설명변수로하여절단된 (truncated) 표준정규분포모형을최우 ( 最尤 ) 추정 7) 하여 와 의추정치 와 를얻는다. 3단계 : 각각의표본에대하여 와 를이용한데이터생성시뮬레이션을통하여역효 율성지표 를만들어서, 8) 이값을이용한새로운투입산출데이터 를구성하여이로부터각표본의역효율성지표 를계산한다. 이과정을 회반복한다. 4단계 : 각각의표본에대하여 3단계에서얻은 개의역효율성지표 표본의평균을이용하여편의를수정한 를얻는다. 5단계 :4단계에서얻은 를피설명변수로삼아서, 절단된 (truncated) 표준정규분포모형을최우추정하여새로운추정량 ( ) 를얻는다. 6단계 : 각각의표본에대해서 ( ) 를이용하여데이터생성시뮬레이션을통하여 9) 새로운역효율성지표 를재구성하고, 이것을피설명변수로삼아서절단된표 7) 즉위의식 (4) 를개별우도로하는최우추정을말한다. 8) 이지표는 의관계를이용하여발생시키며이때 는 N(0, ) 을따르되, 1- 에서좌측이절단된 (truncated) 분포에서발생하는확률변수이다. 9) 3단계와같은방식이며다만모수를 ( ) 를 ( ) 로바꾸어시행한다. 74
부트스트래핑과절단회귀 (truncated regression) 를이용한과수농가의기술효율성분석 이명헌 황수철 준정규분포모형을최우추정하여새로운추정량 ( ) 을계산한다. 이과정을 번반복한다. 7 단계 :6 단계에서얻은 ( ) 의표본을이용하여 ( ) 의신뢰구간을얻는다. 위에서설명한 7단계들은크게 1 4단계와 5 7단계로나누어지는데, 통상적인 2단계효율성분석의틀에비추어보면 1 4단계가통상적 1단계, 즉농가별역효율성지표를계산하는과정에해당되고, 5 7단계가통상적 2단계, 즉환경변수가역효율성지표에미치는영향을분석하는단계이다. 1 4단계의핵심은 3단계인바, 소표본에서편의를보이는역효율성지표의편의를제거하기위해서부트스트래핑을행하는것이다. 5 7단계의핵심은 6단계인바, 비표준적인교란항과설명변수와교란항사이의상관관계때문에 Tobit 추정량의신뢰구간을통상적으로는구할수없다는문제를해결하기위해서부트스트래핑을행하는것이다. Ⅲ. 분석자료 위에서논의한방법론을농촌진흥청이조사 공표하는농산물소득조사의 2013년도원자료중과수 4종, 즉사과, 배, 포도, 복숭아에적용한다. 관측치는모두 100농가를초과하였다. DEA 분석에이용되는산출요소는 10아르당생산량 10), 투입요소는 10아르당복합비료, 퇴구비 ( 堆廐肥 ), 살충제유제, 살균제수화제, 비닐, 포장상자, 전기, 유류, 고용노동등이다. 환경변수로는재배면적과가족노동투입시간을이용한다. 이들변수의기술통계량은다음의 < 표 3> < 표 6> 과같다. 11) 10) 원래의자료에는면적의단위로평 ( 坪 ) 을사용하고있으나, 이논문에서는이를 1평 =3.3제곱미터로환산하여사용한다. 단, 편의상 300평당투입량 은 10아르당투입량 으로표시한다. 11) 투입요소별로투입량이다른농가에비해서특별히큰농가들이존재하는경우표준편차가평균보다큰경우가발생한다. 75
第 32 卷第 3 號 2015 年 9 月 < 표 3> 사과의산출, 투입, 환경변수의기술통계량 n=136 평균 표준편차 최소 최대 outputmq 산출량 (kg) 2,129.5 635.4 200.0 4,129.0 fertilizeq 복합비료 (kg) 53.9 154.7 0.0 1,687.5 toeguq 퇴비 (kg) 1,144.0 1799.7 0.0 10033.4 salchungyu q 살충제유제 (ml) 755.1 803.1 0.0 3,900.0 salgyunsuh q 살균제수화제 (g) 2,621.6 3,379.7 0.0 27,283.2 vinylq 비닐 ( 미터 ) 314.4 268.3 0.0 2,186.6 boxq 포장박스 ( 개 ) 122.3 96.9 0.0 447.5 elecq 전기 (kw) 421.1 872.9 0.0 5,000.0 oilq 유류 ( 리터 ) 66.1 74.8 0.0 700.6 laborem 고용노동 ( 시간 ) 50.6 41.7 0.0 183.2 growarea 재배면적 (10ar) 15.85 9.59 1.65 43.00 laborfa 가족노동 ( 시간 ) 95.2 55.2 0.0 301.0 < 표 4> 배의산출, 투입, 환경변수의기술통계량 n=143 평균 표준편차 최소 최대 outputmq 산출량 (kg) 2,334.3 798.7 566.0 6,000.0 fertilizeq 복합비료 (kg) 70.2 336.9 0.0 3,958.9 toeguq 퇴비 (kg) 1,414.5 2930.9 0.0 29,947.6 salchungyu q 살충제유제 (ml) 476.7 700.7 0.0 3,100.0 salgyunsuh q 살균제수화제 (g) 1,234.5 1,875.5 0.0 14,362.5 vinylq 비닐 ( 미터 ) 3.8 31.8 0.0 285.7 boxq 포장박스 ( 개 ) 145.3 103.5 0.0 495.0 elecq 전기 (kw) 525.3 1,168.0 0.0 11,230.3 oilq 유류 ( 리터 ) 62.6 44.0 0.0 314.4 laborem 고용노동 ( 시간 ) 43.7 31.6 0.0 156.0 growarea 재배면적 (10ar) 15.66 12.15 2.31 99.17 laborfa 가족노동 ( 시간 ) 104.8 67.6 11.4 456.8 76
부트스트래핑과절단회귀 (truncated regression) 를이용한과수농가의기술효율성분석 이명헌 황수철 < 표 5> 포도의산출, 투입, 환경변수의기술통계량 n=155 평균 표준편차 최소 최대 outputmq 산출량 (kg) 1,656.9 639.0 600.0 4,536.0 fertilizeq 복합비료 (kg) 49.1 129.6 0.0 1,023.9 toeguq 퇴비 (kg) 917.1 2,020.3 0.0 14,970.1 salchungyu q 살충제유제 (ml) 320.7 754.0 0.0 5,391.9 salgyunsuh q 살균제수화제 (g) 550.2 1,133.2 0.0 12,131.8 vinylq 비닐 ( 미터 ) 197.4 256.0 0.0 1,928.6 boxq 포장박스 ( 개 ) 371.4 334.6 0.0 3,272.7 elecq 전기 (kw) 154.4 335.9 0.0 3,255.4 oilq 유류 ( 리터 ) 44.1 53.3 0.0 264.0 laborem 고용노동 ( 시간 ) 39.0 55.8 0.0 379.4 growarea 재배면적 (10ar) 6.96 4.75 1.10 28.05 laborfa 가족노동 ( 시간 ) 171.2 100.2 12.1 543.6 < 표 6> 복숭아의산출, 투입, 환경변수의기술통계량 n=130 평균 표준편차 최소 최대 outputmq 산출량 (kg) 1,505.3 736.6 195.0 3,604.0 fertilizeq 복합비료 (kg) 44.9 110.0 0.0 1,080.0 toeguq 퇴비 (kg) 996.3 1462.4 0 10,000.0 salchungyu q 살충제유제 (ml) 560.9 1,056.6 0.0 8,333.3 salgyunsuh q 살균제수화제 (g) 1,451.8 1,204.5 0.0 6,666.7 vinylq 비닐 ( 미터 ) 12.4 59.4 0.0 529.4 boxq 포장박스 ( 개 ) 257.9 157.5 0.0 1075.9 elecq 전기 (kw) 145.5 300.0 0.0 1,727.1 oilq 유류 ( 리터 ) 54.7 73.0 6.0 771.8 laborem 고용노동 ( 시간 ) 25.5 24.8 0.0 117.6 growarea 재배면적 (10ar) 12.94 9.03 1.00 49.50 laborfa 가족노동 ( 시간 ) 137.3 80.8 12.1 544.5 77
第 32 卷第 3 號 2015 年 9 月 개별투입요소들은비료, 살충제, 살균제, 제재료비중에서평균적투입량이많고 0이아닌투입량을보고하는농가가많은요소를선택한것이다. 또한전기, 유류는최근농업경영의지속가능성확보가중요한정책적관심사로부상하고있는점을고려하여포함하였다. 12) 현재전기와유류가격이정부의정책 ( 낮은농업용전기요금, 면세유 ) 에의해서낮게유지되고있지만, 장기적으로여러요인에의하여이러한상황이변화할경우에도농업경영이유지될수있는가가중요한문제라고할수있기때문이다. 또한, 각요소별로투입량이 0으로보고되는농가들이다소존재하지만, DEA 분석에서는개념상일부요소가 0이되더라도효율성을비교하는데는문제가되지않으므로앞에서언급한기준에따라투입요소를결정하였다. 서론에서언급한바와같이재배면적과가족노동역시장기적관점에서는농가가조절할수있는투입변수로보는것이타당할수있으나, 다른변수들에비해서는단기에는조정이어려운환경변수적성격이강하다고볼수있다. 특히, 가족노동시간은농업경영주의효율성증진을위한노력의수준을나타내는대리변수 (proxy variable) 가될수있다는점에서환경변수로선택되었다. 즉, 이연구에서는가족노동시간과고용노동시간을구분하고있는데이와같은두종류의노동의구분은우리나라농가의대부분이가지고있는가족농 ( 家族農 ) 의성격을반영하기위해서중요하다. 가족농은이론적으로경영에필요한항시적노동의대부분을가족노동에의존하고, 경영의목표를가족노동에대한보수의최대화에두는경영체라고할수있다. 이러한가족농에게는가족노동과고용노동은이질적인투입요소가된다. 그이유는첫째, 가족구성원의시간중가족노동시간을공제한여가 ( 餘暇 ) 시간은경영의주체인가족의효용에직접적으로영향을주지만, 고용노동은그런역할을하지못하고, 둘째, 고용노동은노동의동기와감독필요성측면에서가족노동력과다르기때문이다. 13) 또한, 분석에이용한농촌진흥청소득조사자료에는본원적환경변수라할수있는농가경영주의연령, 교육 훈련수준이나주변의농업인프라구조에관한자료가포함되어있지않다는점도가족노동시간을환경변수로이용한현실적이유였음을밝혀둔다. 12) 전기는유류에비해서투입하지않은농가가많지만, 사과의경우 52.2%, 배의경우 64.3%, 포도의경우 43.9%, 복숭아의경우 59.2% 의표본농가가 0보다큰전기사용량을보고하였다. 13) 이에대한자세한이론적논의는 Pollak(1985), Schmitt(1991) 및 Lee(1998) 를참조하라. 78
부트스트래핑과절단회귀 (truncated regression) 를이용한과수농가의기술효율성분석 이명헌 황수철 Ⅳ. 분석결과 효율성결정요인분석을위해서앞에서설명한 Simar and Wilson(2007) 의방법을이용 하였고, 통계분석 DEA 계산, 부트스트래핑및 truncated regression에는 R언어를기반으로한 Simm and Besstremyannaya(2015) 의패키지 rdea를이용하였다. 부트스트래핑에서는 ( 앞의 Ⅱ 장에서설명한추정의 7 단계중제 3 단계에서역효율성지표보정을위한데이터생성시뮬레이션을반 복하는횟수 ) 은 100, ( 추정의 7단계중제 6단계에서추정치의신뢰구간을얻기위해서데이터생성시뮬레이션을반복하는횟수 ) 는 1000으로하였다. Tobit 분석에는 Stata13을이용하였다. 우선, 단순한 DEA 결과로얻은역효율성지표와, 부트스트래핑을통해서추정된, 편의를조정한 [ 이하 보정 ( 補正 ) 한 이라표현한다 ] 역효율성지표를비교하면 < 표 7> 과같다. 이론이시사하는바와같이 DEA값들이커져서, 평균, 표준편차, 최소 최대값이모두커졌다. 특히보정된 DEA 값에따르면역효율성지표가 1이되는, 즉생산가능집합의변경에있는것으로평가되는표본이존재하지않게됨을알수있다. < 표 7> 단순한 DEA 와부트스트래핑으로보정된 DEA 값의기술통계량 작목항목평균표준편차최소최대 사과배포도복숭아 단순 DEA 1.308 0.429 1.000 4.057 보정된 DEA 1.534 0.460 1.107 4.757 단순 DEA 1.359 0.497 1.000 4.421 보정된 DEA 1.653 0.555 1.167 5.295 단순 DEA 1.500 0.544 1.000 3.393 보정된 DEA 1.773 0.641 1.126 3.972 단순 DEA 1.301 0.527 1.000 4.128 보정된 DEA 1.538 0.575 1.137 4.525 아래의 < 표 8> < 표 11> 은이렇게보정된 DEA 값에 Simar and Wilson(2007) 이제안한바와같이 truncated regression을행하고추정계수들의 5% 신뢰구간을부트스트래핑으로추정한결과를보인것이다. 비교를위해서기존의연구들이하였듯이보정되지않은 DEA와 79
第 32 卷第 3 號 2015 年 9 月 보정된 DEA에 Tobit 모형을추정한결과도같이보였다. 보정된 DEA를이용한 Tobit 모형에서는역효율성지수가 1이되는농가가없으므로권오상 김한호 (2009) 와같이그최소값을절단점 (censoring point) 으로하여 Tobit 모형을추정하였다. 14) Tobit 모형추정에서는피설명변수로서단순 DEA 역효율성지수를사용하든보정된 DEA 의역효율성지수를이용하든상수항을제외한환경변수의계수는기본적으로비슷하게나타났다. 상수항은모두보정 DEA에서더크게나타났는데, 이것은보정 DEA의역효율성지수가단순 DEA보다크다는점을고려하면당연한결과이다. 각환경변수들의계수의유의성에도큰차이는없다고할수있다. 사과와배의경우두방법모두에서재배면적과가족노동시간의효과는그계수의절대값이작고통계적으로도유의하지않은것으로나타났다. 단, 포도에서는, 단순 DEA 결과를이용한경우에는가족노동시간이통계적으로유의한효과가없는것으로나타났지만, 보정된 DEA를사용한경우에는그절대값은작지만역효율성을낮추는 ( 즉, 효율성을높이는 ) 효과가통계적유의성이있는것으로나타났다. 끝으로복숭아의경우는단순 DEA와보정 DEA 결과를이용한두가지경우에서모두재배면적과가족노동시간이역효율성을높이는 ( 즉, 효율성을낮추는 ) 효과가있는것으로나타났다. 단, 보정 DEA 결과를이용하는경우재배면적과가족노동시간이역효율성을높이는한계적효과의크기가단순 DEA 결과를이용한경우에비해서조금작게추정되었다는차이점이있다. 그크기는재배면적의 10아르증가가역효율성지수를 0.039 또는 0.032 정도높이는것으로나타났고, 10아르당가족노동시간 1시간증가는역효율성지수를 0.002 또는 0.001 높이는것으로나타났다. 반면, Simar and Wilson(2007) 의방법, 즉보정 DEA 결과를사용하여 truncated regression 추정을하고그추정치의신뢰구간추정을위해서도부트스트래핑을이용한결과는, Tobit 모형과는작목에따라서적지않은차이가나타난다. 이것은역효율성지수를발생시키는확률과정에대한가정이 Tobit과다른모형임을고려하면이해할수있다. 작목별로, 사과와배의경우에는재배면적과가족노동시간의계수가절대값도크지않고통계적으로도유의하지않은것으로나타났는데, 이것은앞에서본 Tobit 모형의결과와기본적으로일치한다고볼수있다. 15) 흥미로운것은포도와복숭아의경우이다. 포도의경우, 재배면적과가족노동시간의계수절대값이 Tobit 모형에비해서상당히크게나타난 14) 절단점을 1보다작은값, 예컨대 0으로설정하면 OLS와같은결과를얻게된다. 15) 이러한결과는앞에서언급한이순석외 (2001) 의경북지역친환경사과재배농가에대한분석과차이를보인다. 그들의연구에서는영농경력과경지면적의증가가효율성을높이는효과가통계적으로유의하게나타났다. 80
부트스트래핑과절단회귀 (truncated regression) 를이용한과수농가의기술효율성분석 이명헌 황수철 다. 그중에서가족노동시간은역효율성을낮추는 ( 즉, 효율성을높이는 ) 효과가통계적으로도유의하게나타났다. 즉, 10 아르당가족노동시간 1시간증가가역효율성지수를 0.005 낮추는것으로나타났다. 복숭아의경우에도 Tobit 모형과주목할만한차이를보여준다. 즉, Tobit 모형에서는재배면적과가족노동시간증가가모두역효율성을높이는 ( 즉, 효율성을낮추는 ) 효과가있는것으로나타났던것과달리, 부트스트래핑을이용한 truncated regression 모형에서는재배면적의증가만이통계적으로유의한역효율성증가효과를가지는것으로나타나고, 가족노동시간에대해서는그러한효과가통계적으로유의하지않은것으로나타났다. 가족노동은고용노동에비해서더노동의동기 (motivation) 가강하고, 고용노동에대한관리기능도가질수있음을고려할때, 가족노동이역효율성을증가시킨다고확신할수없다는이러한추정결과가, 가족노동시간증가가역효율성을증가시킨다고하는 Tobit 추정결과에비해서, 더이론적고려와부합한다고할수있을것이다. 요약해보면, 재배면적의경우는 Tobit 모형과 Simar and Wilson(2007) 의방법모두에서복숭아에서만통계적으로의미있게효율성을낮추는것으로나타났다. 반면, 가족노동시간은 Tobit 모형에서는포도에서는통계적으로의미있게효율성을높이고, 복숭아에서는효율성을낮추는것으로나타났지만, Simar and Wilson(2007) 의방법론을따른추정에서는가족노동시간이포도에서효율성을높이는효과는더강하게확인되지만, 복숭아에서효율성을낮추는효과는통계적으로유의하게나타나지않았다. < 표 8> 사과농가의효율성결정요인분석 추정방법변수계수표준오차 t 값유의수준 단순 DEA, Tobit 보정 DEA, Tobit 보정 DEA truncated 모형부트스트래핑 95% 신뢰구간 하한 상한 상수 *1.179 0.192 6.130 0.000 0.799 1.559 growarea 0.000 0.007 0.030 0.975-0.013 0.013 laborfa -0.001 0.001-0.660 0.513-0.003 0.002 상수 *1.520 0.123 12.310 0.000 1.276 1.764 growarea 0.000 0.004 0.060 0.953-0.008 0.009 laborfa 0.000 0.001 0.110 0.909-0.001 0.002 상수 -2.2592e-1-6.891 1.611 growarea 1.3049e-5-0.0002 0.0002 laborfa 3.1082e-4-0.0107 0.0099 81
第 32 卷第 3 號 2015 年 9 月 < 표 9> 배농가의효율성결정요인분석 95% 신뢰구간추정방법변수계수표준오차 t 값유의수준하한상한상수 *1.267 0.1832 6.920 0.000 0.905 1.629 단순 DEA, growarea -0.000 0.006-0.070 0.943-0.013 0.012 Tobit laborfa -0.002 0.001-1.370 0.174-0.004 0.001 상수 *1.803 0.118 15.270 0.000 1.569 2.036 보정 DEA, growarea -0.003 0.004-0.660 0.508-0.010 0.005 Tobit laborfa -0.001 0.001-1.490 0.139-0.002 0.000 보정 DEA truncated 모형부트스트래핑 상수 0.792-2.926 2.162 growarea -0.015-0.070 0.022 laborfa -0.006-0.021 0.002 < 표 10> 포도농가의효율성결정요인분석 95% 신뢰구간추정방법변수계수표준오차 t 값유의수준하한상한상수 *1.597 0.162 9.840 0.000 1.276 1.917 단순 DEA, growarea -0.004 0.012-0.360 0.721-0.028 0.020 Tobit laborfa -0.001 0.001-1.400 0.163-0.002 0.000 상수 *2.047 0.159 12.90 0.000 1.734 2.361 보정 DEA, growarea -0.011 0.012-0.90 0.371-0.034 0.013 Tobit laborfa *-0.001 0.001-2.110 0.036-0.002-0.000 보정 DEA truncated 모형부트스트래핑 상수 1.482-1.110 2.865 growarea -0.046-0.168 0.046 laborfa *-0.005-0.014-0.000 < 표 11> 복숭아농가의효율성결정요인분석 95% 신뢰구간추정방법변수계수표준오차 t 값유의수준하한상한상수 0.058 0.283 0.21 0.837-0.502 0.619 단순 DEA, growarea *0.039 0.010 3.78 0.000 0.018 0.059 Tobit laborfa *0.002 0.001 2.08 0.040 0.000 0.005 상수 *0.927 0.141 6.58 0.000 0.648 1.206 보정 DEA, growarea *0.032 0.006 5.82 0.000 0.021 0.043 Tobit laborfa *0.001 0.001 2.20 0.029 0.000 0.003 보정 DEA truncated 모형부트스트래핑 상수 *-5.604-21.145-0.786 growarea *0.173 0.066 0.443 laborfa 0.009-0.001 0.027 82
부트스트래핑과절단회귀 (truncated regression) 를이용한과수농가의기술효율성분석 이명헌 황수철 Ⅴ. 요약및결론 이상에서농촌진흥청소득자료를이용하여과수생산의효율성에환경변수로서재배면적과단위면적당가족노동시간투입시간이주는영향을살펴보았다. 분석을위해 Simar and Wilson(2007) 의기법을이용하여농가별효율성추정에 DEA와부트스트래핑기법을적용하고, truncated regression 모형을적용하면서회귀분석추정량의신뢰구간추정에부트스트래핑기법을적용하였다. 이추정결과와기존에많이이용된방식, 즉단순한 DEA 값또는부트스트래핑으로보정된 DEA 결과에 Tobit 모형 ( 즉 censored regression 모형 ) 을사용한방식의추정결과와비교해보면, 사과와배에서는큰차이가나타나지않았다. 반면, 포도에서는 Simar and Wilson(2007) 의기법에따를경우가족노동이효율성을높이는효과가더강하게나타났다. 또한복숭아에서는, Tobit 모형이가족노동시간이효율성을낮추는효과를보여주는것과달리, Simar and Wilson(2007) 의기법을따를경우에는그러한효과가통계적으로유의하게나타나지않아서가족노동과고용노동의차이에관한이론적고려에상대적으로더부합하는결과를보여주었다. 이결과가주는정책적함의는, 적어도일부과수 ( 포도 ) 작목에서는가족노동을고용노동으로대체하는것이기술적효율성을낮출가능성이있다는점이다. 물론개별농가는가족노동의기회비용과고용노동의가격 ( 임금 ) 을비교하여전자를후자로대체할수있으며, 이때발생하는기술적효율성의감소를배분적효율성의증대가상쇄할수도있다. 그러나그러한상쇄가항상일어난다고확신하기는어렵다. 따라서필요한가족노동시간을확보할수있도록하는보건, 위생, 작업환경개선과관련된투자, 그리고가족노동이경영이외로유출되는것을줄일수있도록하는전문마케팅조직의육성, 정보수집이나각종의사결정에있어서 IT 기술의활성화등을지원할필요가있을것이다. 방법론적으로는, 단순 DEA 결과를이용하는가보정된 DEA 결과를이용하는가하는것보다는, 계수추정에 Tobit 모형 ( 즉 censored regression) 을사용하는가아니면절단된회귀모형 (truncated regression) 을사용하는가, 그리고얻어진추정치의분산행렬추정을통상적인방법으로행하는가아니면확률적과정을고려한부트스트래핑을이용하는가가더중요하다고볼수있다. 효율성지수의정의상, 그리고부트스트래핑으로편의를조정한효율성지표가정확히 1이되는경우는없다는점을고려하면, 절단된 DEA를발생시키는확률적과정 83
第 32 卷第 3 號 2015 年 9 月 을모형화함에있어서절단된회귀모형을사용하는것이합리적이라고판단된다. 그러나이문제는완전히해결된것으로보기는어렵다. 16) 단, 이연구에서보듯이모형에따라서환경변수의효과와통계적유의성이서로다르게나타나는경우가있으므로, 기존의 Tobit 모형을적용하는경우에는신중함이요구된다고하겠다. 참고문헌 권오상 김한호, 확률 DEA-FDH 기법을이용한산지유통및수급안정조직의경영성과와그결정요인분석 : 산지유통종합평가자료를중심으로, 농업경제연구, 50권 2호, 한국농업경제학회, 2009. 농림축산식품부, 농림축산식품주요통계, 2014. 문한필 전익수 김성우, 한칠레 FTA 국내대책에따른과수농가생산성및효율성개선효과계측, 농업경영 정책연구, 41권 4호, 한국농식품정책학회, 2014. 송경환 김병무 이상호, 나주배농가의경영실태및효율성분석, 한국지역경제연구, 16집, 한국지역경제학회, 2010. 우수곤 유진채 강경하 신용광, 배농가의경영효율성분석 : 비모수적접근방법에의한사례연구, 한국농촌지도학회지, 9권 2호, 한국농촌지도학회, 2002. 이상호, 농업유통법인의효율성분석, 농업경영 정책연구, 37권 1호, 한국농식품정책학회, 2010. 이순석 김충실 이상호, 비모수적접근에의한친환경농업의효율성분석-사과생산을중심으로, 농업경제연구, 42권 2호, 한국농업경제학회, 2001. 이순석 조성주 정호근, 콩생산의효율성요인분석과벤치마킹, 농업경영정책연구, 30권 3호, 한국농식품정책학회, 2003. 이정동 오동현, 효율성분석이론, 지필미디어, 2012. 한채환 국승용 김지연 전익수 김성훈, 주요원예농산물경영실태분석및생산비절감방안, 연구보고서 R707, 한국농촌경제연구원, 2013. 16) 이정동 오동현 (2012) 도투입기준 DEA 에기초한효율성분석에서, OLS 대신 Tobit 모형을사용하는것의타당성에대해서아직도논쟁이진행중이라고언급한바있다 ( 이정동 오동현, 2012:251). 84
부트스트래핑과절단회귀 (truncated regression) 를이용한과수농가의기술효율성분석 이명헌 황수철 황수철 유리나 유영봉, 농업산출의추계와분석 (1955 2012년), 식품유통연구, 31권 4호, 한국식품유통학회, 2014. Lee, Myungheon, Off-farm Labor Supply and Various Related Aspects of Resource Allocation by Agricultural Households, Doctoral Dissertation at Georg-August- Universität Göttingen, 1998. Pollak, R., A Transaction Cost Approach to Families and Households, Journal of Economic Literature, Vol 23, 1985, pp.581 608. Schmitt, G., Why is Agriculture of Advanced Western Economies Still Organized by Family Farms and will this be also in the Future?, European Review of Agricultural Economics, Vol 18, 1991, pp.443 458. Simar, L. and Wilson, P., Sensitivity Analysis of Efficiency Scores:How to Bootstrap in Nonparametric Frontier Models, Management Science, 44(11), 1998, pp.49 61. Simar, L. and Wilson, P., A General Methodology for Bootstrapping in Nonparametric Frontier Models, Journal of Applied Statistics, 27, 2000, pp.779 802. Simar, L. and Wilson, P., Estimation and Inference in Two-stage, Semi-parametric Models of Production Processes, Journal of Econometrics, 136, 2007, pp.31 64. Simm, J. and Besstremyannaya, G., Package rdea, Repository CRAN, 2015. (https://github.com/jaak-s/rdea 2015.8.14. 접근 ). 원고접수일:2015년 08월 09일 1차수정일:2015년 09월 01일 2차수정일:2015년 09월 19일 게재확정일:2015년 09월 21일 85