사망확률보정방법적용에따른기대여명비교 * 박성근 * 1) < 요약 > 사망확률은 세의 사람이 세에 도달하지 못하고 사망할 확 률을 말하며 생명표 작성의 근간이 된다. 생명표 작성에 사용되는 사망확률은 원 자료의 사망확률이 아닌 좀 더 안정적인 형태로 보 정된 사망확률을 사용한다. 현재 미국 보건 센터 (NCHS) 와 우리나라 통계청에서는 각각 다 른 방식으로 사망확률을 보정한다. N CH S 에서는 사망확률을 B e e rs 의 보정계수를 이용한 보정식을 이용하여 보정하고 있으며 통계청 은 9차항 보정식을 이용하여 사망확률을 보정하고 있다. 본 논문에서는 Beers의 보정계수와 보정식에 대하여 알 아보고 이 두 가지 보정 방법을 2000년부터 2007년까지 0세-94세 의 남녀 각 세별 주민등록인구와 사망자 수 자료에 적용하여 정확 도 (Fitness) 및 평활도 (Smoothness) 에 대해 알아보았다. 또한 보정식의 각 차 항에 대해서도 각각 적합도와 평활도에 대해 알아보았다. 마지막으로 각 보정방법에 의한 사망확률을 이용하여 기대여명을 구한 후 이를 통해 보정방법들 간의 특성을 비교하였다. * 이논문은박성근의석사학위논문을바탕으로추가연구하여작성한것입니다. 135-239 : 서울시강남구수서동, 고려대학교경제통계학과석사졸업 E-mail : amethyst7@nate.com
Ⅰ. 서론 사망은인구성장의본질적인요인의하나로서인구감소를가져오게하는요인이다. 또한전연령층에확대되어발생함으로써인구구조의전체변화에직접적인영향을미치고있다. 사망수준의감소는고령화현상과같은사회현상의변화를동반한다. ( 통계교육원, 2008) 현재우리나라의인구문제중가장심각한문제는고령화문제이다. UN이제시한기준에위하면고령화사회란총인구중 65세이상의인구가차지하는비율이 7% 인이상인사회를이야기한다. 또한총인구중 65세이상의인구가차지하는비율이 14% 이상이면고령사회, 20% 이상이면초고령사회라고한다. 통계청에서발표한 '2008년고령자통계 ' 자료에따르면 2008년 7월 1일현재우리나라의 65세이상인구는 5,016천명으로전체인구의 10.3% 를차지하고있다. 이는인구 10명당 1명은 65세인구라는이야기이다. 2000년에이미고령화사회에진입한우리나라는 2018년에는고령사회, 2026년에는초고령사회에진입할것으로예상되고있다. 이러한우리나라의고령화현상은세계어떤나라보다도매우빠르게진행되고있다는데더큰문제가있다. 2005년 OECD 한국경제보고서 에의하면우리나라사회가고령화사회에서고령사회까지소요되는기간이약 22년정도될것이라고예상하고있다. 이는프랑스 (116년), 미국 (71년), 영국 (47년) 등과비교하였을때매우빠른것이며심지어세계에서고령화속도가가장빠르게진행되었다는일본 (24년) 보다빠르게진행되고있음을나타낸다. 이러한고령화사회의문제는여러가지사회문제를야기시킨다. 생산인구는감소하는데비해고령인구는증가하여생산인구의부양책임을점점과도하게만들어세대간의갈등등의사회문제를발생시킬수있기때문이다. 또한연금및건강보험의지급부담, 저축률감소로인해경제문제를발생시킬수있으며, 결국
에는국가경쟁력을저해시키는원인이될수도있기때문이다. 따라서이러한문제를미리예방하기위해서는많은연구를통하여정책을개발하는것이절실히요구되는데이러한연구에사용되는자료중하나가생명표이다. 생명표란현재의사망상태를기준으로하여장래의생존기간을계산하는것으로사망확률에따라서인구가줄어드는모습을표의형식으로나타내는것이다. 여기서사망확률이란정확한연령 세의사람이 세에도달하지못하고사망할확률을말한다. 생명표를작성하기위해서사용되는사망확률은모두원자료의사망확률이아닌보정된사망확률을이용한다. 사망확률을보정하는이유는불규칙한값을수정하고평활효과를이용하여사망확률을보다안정적으로변형시켜분석결과를보다안정적으로나타내기위해서이다. 본논문에서는사망확률보정하는여러방법중 NCHS( Nat i o nal Center for Health Statistics) 에서사용하는 Beers 보정계수를이용한방법과우리나라통계청에서사용하고있는 9 차항계수를이용한방법을이용하여두방법의정확도및평활도를비교연구하였다. 본논문에전개를위하여 2절에서는통계청과 NCHS의사망확률보정방법대해설명하였으며 3절에서는 Beers의보정계수에대한내용을다루었으며 4절에서는 9차항계수를계산하는방법인이동가중평균에대해설명하였다. 5절에서는 2000년부터 2007 년까지 0세-94세각세별남녀주민등록인구와사망자수를이용하여두보정방법및 G rev i lle 보정식의결과를비교하고기대여명을비교하였다. 6절에서는논문의연구결과를정리하였다.
Ⅱ. 통계청과 N C H S 의사망확률보정방법 보정이란관측치로부터초기값을산출하고, 여기에통계적이론을적용하여초기값의적합도 (fitness) 을유지하면서평활도 (smoothness) 을구성하는참값을추정하는일련의과정을말한다고할수있다. 현재통계청과 NCHS(National Center for Health Statistics) 에서는생명표를작성할때사망확률을보정하고있다. 통계청에서는보정된주민등록인구와사망자수를이용하여사망률을계산한후이를이용하여사망확률을계산한다. 이후계산된사망확률은 9차항보정식을이용하여보정한후생명표작성에사용된다. 그러나 NCHS에서는 Beers의보정계수를이용한보정공식에의하여보정된인구와사망자수를산출한후이를이용하여보정된사망확률을계산하고생명표작성에사용한다. 즉통계청과 NCHS의사망확률의보정방법중가장큰차이점은통계청은사망확률그자체를보정하는반면에 NCHS는보정된인구와사망자수를이용하여계산된사망확률을특별한보정없이사용한다는데있다. Ⅲ. B e e r s 의보정계수 1. 6 개항보정공식 ( S i x- t e r m In t e r po l a t i o n f o r m ul a ) 현재 NCHS에서사용하고있는 Beers의보정계수를이용한보정방법의근간인 6개항보정공식 (Six-term Interpolation formula) 은 Beers가 1944년제안한공식이다. 이보정공식의가장큰특징은좌우대칭형이기때문에 와같이좌우대칭형태의 6개의값을통해추정한값과
을통해추정한값이동일하다는것이다. 5 계계차최소화방법 (Minimized-fifth-differences) 조건 식 (1) 은 6개항 보정공식의 계수 값을 얻는 방법인 5계 계차 최 소화 방법의 기본식이다. 식 (1) 의 는 계차라 하는 것으로 의 형태로 정의 된다. 이 계차는 차분과 마찬 가 지로 상위계차는 하위계차로, 하위계차는 상위계차로 자유롭게 표 현이 가능하다. 5계 계차 최소화 방법 목적은 5계 계차 항 ( ) 계수들의 제 곱 합의 형태로 되어있는 식을 최소화하여 식 (1) 의 해를 구한 후 전체 식을 1차 계차식의 형태로 전개하여 보정계수를 구하는 것이다. 제곱 합을 최소화 하는 는, 으로 결정된다.(Beers, 1944) Beers의 보정계수를 계산 하는 방법 및 자 세한 내용은 김성훈 (2008) 을 참고하길 바란다. Beers의 보정계수를 이용한 보정방법의 장점 및 특성은 다음과 같다. 첫째, 다른 보정방법과는 달리 원 자료의 총합과 보정된 자 료의 총 합이 같다는 것이다. 이러한 특징을 가지는 이유는 Beers 의 보정방법은 각 세별 자료를 그룹으로 묶은 후 다시 보정된 각 세별 자료로 뿌려주기 때문이다. 따라서 각 세별 자료가 제공되지 않고 5세 그룹별 자료와 같은 그룹별 자료만 제공되는 인구자료만 가지고도 보정된 각 세별 인구자료를 추정할 수 있는 장점을 가지
고있다. 둘째, 적용방법이매우편리해쉽게쓸수있다는것이다. 보정계수를구하는방법은매우복잡하지만적용하는데있어서는보정계수와그룹별자료간의간단한선형결합을이용하여보정결과를쉽게구할수있기때문에그적용이매우편리하다. 마지막으로보정계수는불변하기때문에데이터에의존하지않고사망자수및인구수등어떠한자료에도사용할수있다는장점을가지고있다. < 표 1> B e e r s 의 5 세연령그룹보정계수 보간그룹 5세별연령구간 0 5 10 15 20 0 ~ 4 세 0세 +0.3333-0.1636-0.0210 +0.0796-0.0283 1세 +0.2595-0.0780 +0.0130 +0.0100-0.0045 2세 +0.1924 +0.0064 +0.0184-0.0256 +0.0084 3세 +0.1329 +0.0844 +0.0054-0.0356 +0.0129 4세 +0.0819 +0.1508-0.0158-0.0284 +0.0115 0 5 10 15 20 5 ~ 9 세 5세 +0.0404 +0.2000-0.0344-0.0128 +0.0068 6세 +0.0093 +0.2268-0.0402 +0.0028 +0.0013 7세 -0.0108 +0.2272-0.0248 +0.0112-0.0028 8세 -0.0198 +0.1992 +0.0172 +0.0072-0.0038 9세 -0.0191 +0.1468 +0.0822-0.0084-0.0015 x- 1 0 x- 5 x x+ 5 x+1 0 5x ~ 5x+5세 x세 -0.0117 +0.0804 +0.1570-0.0284 +0.0027 x+1 세 -0.0020 +0.0160 +0.2200-0.0400 +0.0060 x+2 세 +0.0050-0.0280 +0.2460-0.0280 +0.0050 x+3 세 +0.0060-0.0400 +0.2200 +0.0160-0.0020 x+4 세 +0.0027-0.0284 +0.1570 +0.0804-0.0117 80 85 90 95 100 95세 ~ 99세 95세 -0.0015-0.0084 +0.0822 +0.01468-0.0191 96세 -0.0038 +0.0072 +0.0172 +0.01992-0.0198 97세 -0.0028 +0.0112-0.0248 +0.2272-0.0108 98세 +0.0013 +0.0028-0.0402 +0.2268 +0.0093 99세 +0.0068-0.0128-0.0344 +0.2000 +0.0404
< 표 1> 은 5계계차최소화방법을이용해얻은보정계수를 5세별인구자료에적용할수있도록정리한표로서현재 NCHS에서는이보정계수표를이용하여인구수및사망자수를보정하고있다. (United States Life table, 2004) 2. B e e r s 의보정계수적용방법 Beers 의보정계수의장점은적용하는데편리하다는것이다. Beers 의보정계수를이용하여보정결과를얻기위해서는 < 표 1> 의보정계수값과식 (2) 를이용하여쉽게구할수있다. 0-4 세 5-9 세 10-94 세 95 세이상 (2) 식 (2) 에서 는 세 ( 의인구수를나타내며 는해당연령그룹의 Beers의보정계수를나타낸다. Beers의보정계수를이용하여보정결과를얻기위해서는기준이되는 5세연령구간을포함하여앞, 뒤 2개씩총 5개의 5세별인구
수가필요하다. 예를들어서 30세-34세의인구수를각세별로보정하기위해서는 30세-34세의인구수외에 20세-24세, 25세-29세, 35세-39세, 40세-44세의 5세별인구수가필요하다. 이러한방법으로 Beers의보정계수를이용한보정공식을이용하여 0세-100세까지의보정된인구수를계산할수있다. 보정된인구수는앞의식 (2) 를통해서계산할수있지만보정된사망자수를계산하기위해서는추가적으로고려해주어야할것이있다. 이는영유아기의사망률이높기때문인데만약관측된 0세-4세까지의계산된사망수를이용하여보정된사망자수를구하면실제값과차이가많이나는보정값이나오게된다. 따라서이러한문제점을해결하기위해서사망자수를보정하기위해서는관측된 0세-4세까지의계산된사망자수가아닌조정된 0세-4 세까지의사망자수를구하여사망자수보정에사용한다 (NCHS, 1999). 식 (3) 에서 는가공의 0세부터 4세까지의사망자수의합을나타내며 는관측된 2세, 3세, 4세의사망자수의합을나타낸다. 는 Beers의보정계수를이용하여보정할때실제의 0세에서 4 세까지의사망자수로사용되어 0-4세, 5-9, 10-15세의사망자수보정에사용된다. Ⅳ. G r e v i l l e 보정식 1. 이동가중평균 ( M o v i n g- We i gh t e d - Av e r a ge ) 보정식의근간이되는이동가중평균 (moving-weighted
-average) 은연속적인몇개의값들을가중평균에의하여보정값으로바꾸는방법으로, 어떤한변수의불규칙한값들을제거하거나줄여서평활시켜주는전통적인보정공식중의하나이다. 기본적으로이동가중평균은다음과같은특징을가지고있다. 첫째, 보정값은첨자가 에서 까지의 개의연속적인보정전값의가중평균에의해구해진다. 즉 5개의항으로 의보정값을구하기위해서는,,,, 의가중평균으로구해진다. 둘째, 대칭적인가중평균만고려한다, 즉계수값 은, 인경우만고려된다. 이런특징을갖는이동가중평균의기본식은식 (4) 와같다. (4) 여기서 는 보정 값, 는 가중 치, 는 원 자료 값을 나타낸 다. 2. 최소 방법 좋은이동가중평균이란적합도 (fitness) 와평활도 (smoothness), 이두개를적절히만족시켜주는식을말한다. 이적합도와평활도는양면의성질을가지고있다. 즉적합도를올리면평활도는떨어지고반대로평활도를올리면적합도는떨어지게된다. 따라서이두가지를적절히조화시키는가중치를구하는것이중요하다고할수있다. 만약적합도만을강조한다면다음식 (5) 가성립된다.,, (5)
만약어떤원자료값에대한보정값이적합도가매우뛰어나다면식 (4) 와식 (5) 를통해알수있듯이모든 에대해서 = 이된다. 따라서적합도가뛰어난보정값을얻기위해서는모든 에대해서 = 가되어야하며이것을이용하여적합도척도로식 (6) 을만들수있다. (6) 만약어떤보정식에의해적합도가제일뛰어나다면식 (6) 의 값은 1에가까울것이다. 즉적합도의관점에서보면식 (6) 의 값이 1에가까울수록적합도가뛰어난보정값이라고할수있다. 그러나이 를최소화하는보정식은일반적으로사용하기에는문제점이있다. 앞에서설명하였듯이좋은이동가중평균은적합도뿐만아니라평활도도만족시켜야한다. 예를들어서사망확률이안정적이지않고불규칙하다면이는상식적인견해와일치하지않기때문에믿을수없을것이다. 식 (6) 의 에평활도를포함해서표현을하면식 (7) 과같이표현할수있다. (7) 식 (7) 의 는식 (6) 의 를일반화시킨식이다. 식 (7) 에서 는차분정도를나타내며식 (6) 의 는식 (7) 의 에서 가 0 일때얻을수있는값이다. 식 (7) 에차분정도를나타낸것은자료의평활도를측정하기위해서이다. 앞의식 (5) 를만족하고식 (7) 을최소화시키는가중치 을구하여보정값을구하는방법을최소 방법이라고한다. 일반적으
로 의값이 0일때보다는 2, 3, 4일때정확성및평활도가더뛰어나다고알려져있다. 3. G r e v i l l e 보정공식 만약모든원자료 에대해서어떤보정공식에의해 차의항, 또는그이하의차수를가진다항식 의값과이를보정하여구한보정값이같다면그보정공식은 차, 또는그이하의다항식을보정하는경우정확한값을구할수있다고말한다. 여기서다항식 를 로나타냈을때 은 3이된다. 예를들면 차의다항식의값이 이고이를보정하여구한값이 일때 가된다면이는정확한값을구할수있다고말할수있다. 만약가중치가대칭으로나타나는경우에는차수 은항상홀수가되어야한다. 단순평균인경우차수 은 1이고이동가중평균은일반적으로차수 을 3으로이용한다. 식 (5) 를 차또는그이하의다항식을보정하는경우정확한값을구할수있다고하면식 (5) 는식 (8) 과같이표현할수있다. (8) 사망률이나사망확률곡선이대부분의나이구간에서부드러운곡선의형태를가지고있기때문에차수 이 3을이용하는데에는무리가없다고볼수있다. 식 (5) 를만족하고식 (7) 의 를최소화하는식 (8) 의 를행렬로표현하면식 (9) 와같이표현할수있다 (Shiu, 1984). (9)
식 (9) 의 는가중치값으로 의벡터형태로나타낼수있으며 으로나타낼수있다. 벡터 는 의값이 0일때만 1이고다른부분에서는 0이다. 식 (9) 의 는 의행과 의열을가진행렬로식 (10) 과같이표현된다. (10) 식 (10) 의 는 의행과 의열을가진차분행렬이며 는 차또는그이하의차수를가진다항식의선형공간에대한기저로 로표현된다. 보정식이란식 (5) 를만족하고식 (7) 의 3일때최소화되며다항식의차수가 3일때계산하여나온가중치 를이용하여표현된이동가중평균식이다. 현재통계청에서사용하고있는 9차항식이란앞에서계산된 보정식중보정되지않은어떤값을보정하는데사용되는항의수가 9개인식을이야기한다. (11) 식 (11) 은 9차항의계수값을나타낸것이다. 보정식은통계청에서사망확률보정시사용하는 9차항보정식뿐만아니라 5차, 7차, 11차, 13차등 개의항을가진보정식으로만들수있다.
5차항 7 차항 11 차항 13 차항 (12) 식 (12) 는 5차항, 7차항, 11 차항, 13 차항의계수값을나타낸식이다. 이보정식역시식 (5) 를만족하고식 (7) 의 3일때최소화하며다항식의차수가 3일때계산하여나온가중치 로계산된식이다. 보정식을포함한이동가중평균은 Beers의보정계수와마찬가지로적용의편리성, 계수의불변성을만족한다. 그러나 Beers의보정방법과는달리적합정도와평활정도를조절할수있는반면원자료와보정자료간의내적일치도 (internal consistency) 는만족시키지못한다.
4. 이동가중평균의말단값문제 이동가중평균은 기본식의 형태를 보면 알 수 있듯이 이동가중평 균은 말단 값을 보정하지 못한다는 단점을 가지고 있다. 따라서 이 말단 값 문제를 해결하기 위하여 여러 사람들이 많은 방법들이 제 시하였으며 그 중 (1981) 의 방법이 제일 우수한 방법이라고 인정되고 있다. 의 방법이란 이동가중평균을 이용하여 보정이 불가능한 양 말단 값에 개의 부수적인 값을 추가하여 말단 값을 보정하는 방법 이다. 예를 들어 9차항을 이용해 보정을 한다면 양 말단 값 에 4개의 부수적인 값을 추가하여 말단 값을 보정하는 방법이다. 5차항 7차항 9차항 11차항 13차항 (13) 식 (13) 은 차항의말단값에부수적인항을추가하는데사용되는계수값들이다. 현재통계청에서도말단값보정을위해식 (13) 의 9차항을이용하고있다. 이계수값의자세한유도과정및적용방법은 (1981) 논문을참고하기바란다.
Ⅴ. 실증분석 1. 두보정방법의사망확률보정결과비교 실증분석에사용된자료는통계청 KOSIS(http://kosis.kr) 에서제공하는 2000년-2007년남, 녀주민등록인구통계와통계청 KMDSS (http://kmdss.nso.go.kr/mdssext/) 에서제공한 2000년-2007년사망자수통계이다. 본논문에서사용한 Beers의보정계수를이용한사망확률보정방법은각세별인구및사망자수를 5세별로묶은후 Beers의보정계수를이용하여각세별로나누어진보정인구및사망자수를얻은후분석에사용하였으며 보정방법은각세별인구및사망자수를그대로이용하여사망확률을계산한후 보정식을이용하여사망확률을보정한후분석에사용하였다. 또한통계청에서는사망자수를각세별자료가 0세부터 100세이상까지제공하지만주민등록인구수는각세별자료가 0세부터 94세까지만제공되고 95세이후는묶여서제공되기때문에모든사망확률보정은 0세부터 94세까지만실시하였다. 0세의사망확률은높은영아사망률로인해통계청과 NCHS에서는별도의보정방법을이용하여사망확률을보정하고있다. 따라서본논문에서는 0세의사망확률은통계청생명표에서제공하는보정된사망확률을그대로가져와사용하였다. < 표 2> 는실증분석에사용된자료및방법을정리한표이다. 사망확률은그래프로나타내면 60세이전까지는증가하는폭이작다가 60세이후로는갑자기증가하는형태로나타내어지며변동을쉽게알아볼수가없다. 그러나로그사망확률은나이키패턴의형태로나타나지만사망확률과는달리변동을쉽게알아볼수있는장점을가지고있다. 따라서본논문은분석은사망확률을이용하였지만모든그래프는사망확률이아닌로그사망확률로나타
내었다. < 그림 1> 은사망확률그래프와로그사망확률을나타낸그림이다. < 표 2 > 실증분석분석자료및적용방법 분석자료 적용범위 통계청에서제공한 2000년-2007년주민등록인구자료및통계청 KMDSS에서제공한사망자 ( 각세 / 전체 / 성별 ) 수 - 1세에서 94세인구및사망자수적용 - 0세의사망확률은통계청에서제공한생명표의 0세사망확률사용 Beers 보정계수적용 : 각세별인구수와사망자수를 5세별로묶을후 Beers의보정계수를이용하여다시각세별로보정한후사망확률계산 적용방법 보정식적용 : 각세별인구수와사망자수를이용하여사망확률을계산한후 보정식을이용하여사망확률보정 사망률 사망확률 : 사망률 < 그림 1 > 2 0 0 7 년전체각세별사망확률및로그사망확률
< 그림 2 > 2 0 0 0 년 - 2 0 0 7 년남자각세별사망확률 < 그림 3 > 2 0 0 0 년 - 2 0 0 7 년여자각세별사망확률
< 그림 2> 와 < 그림 3> 은 2000년-2007년까지의남자와여자의로그사망확률을나타낸그래프이다. 가로축은연령을나타내며세로축은로그사망확률을나타낸다. 그림을보면알수있듯이연도가증가할수록사망확률은동일한연령대에서낮아지고있으며로그사망확률또한작아지기때문에그래프가아래쪽으로내려오는것을알수있다. < 그림 4> 와 < 그림 5> 는 2007년각세별남자와여자의사망확률을 Beers의보정계수를이용한방법과 9차항보정식을이용하는방법을적용하여구한보정된사망확률을그래프로나타낸것이다. 앞의그림과마찬가지로가로축은연령을나타내며세로축은로그사망확률을나타낸것이다. < 그림 4 > 두보정방법을이용한 2 0 0 7 년남자로그사망확률
< 그림 5 > 두보정방법을이용한 2 0 0 7 년여자로그사망확률 < 그림 4> 와 < 그림 5> 를보면알수있듯이두보정방법모두남성과여성의원사망확률을잘따라가면서보정해주는것을알수있다. 그러나 6세에서 16세의원자료의사망확률을보정한결과를보면 Beers 의보정계수를이용한보정방법이 9차항을이용한보정방법보다더평활하게보정하는것을알수있다. 일반적으로보정방법들의적합도와평활도를비교할때사용할때사용되는방법은식 (14) 와같이 MSE(Mean Squared Error) 와 3차차분을합하여평가하는방법을사용하고있다. (London, 1981) 적합도 : 평활도 : (14) 위의식 (14) 를이용하여 2000 년 -2007 년까지의각세별전체, 남자,
여자의원사망확률을 B e e rs 의보정계수를이용한보정방법과 9차항을이용하여보정한결과에대해서적합도및평활도을비교한것이 < 표 3> 와 < 표 4> 이다. < 표 3> Bee r s 의보정방법과 Gr e vi l l e 9차항의보정방법을이용한보정된사망확률과원자료사망확률에대한 MSE 비율 2000 2001 2002 2003 2004 2005 2006 2007 남자 1010% 754% 232% 946% 638% 217% 284% 130% 여자 257% 625% 219% 756% 483% 463% 475% 737% 전체 108% 409% 188% 821% 542% 373% 447% 376% 주 : 결과 값 : Beers의 MSE / 9차 MSE < 표 4> Bee r s 의보정방법과 Gr e vi l l e 9차항의보정방법을이용한보정된사망확률과원자료사망확률에대한 3차차분값비교 2000 2001 2002 2003 2004 2005 2006 2007 남자 2.4% 3.0% 4.9% 7.1% 5.0% 4.3% 3.3% 5.2% 여자 2.1% 2.2% 3.3% 4.7% 4.1% 3.4% 2.7% 2.4% 전체 2.0% 2.2% 3.5% 4.9% 4.0% 3.4% 2.6% 2.0% 주 : 결과 값 : Beers의 3차 차분 / 9차 3차 차분 결과값이 100% 보다크게나오면 9차항의보정방법이 Beers의보정방법보다좋다는결과를나타내는것이며반대로결과값이 100% 보다작게나오면 Beers 의보정계수를이용한보정방법이 Gr e v i l l e 9 차항보정방법보다좋다는결과를나타내는것이다. 결과값의기준을 9차항으로한것은현재통계청에서사용하고있는사망확률보정하는방법이 9차항을이용한방법이기때문에통계청에서사용하는방법이좋은지좋지않은
지비교하기위하여기준을 9차항으로정하였다. < 표 3> 의결과를보면모든연도및성별에대하여결과값이 100% 이상인것을알수있다. 이는 9차항의보정방법이 B ee r s 의보정계수를이용한보정방법보다적합도부분에서는더뛰어나다는것을나타내는것이다. 평활도에대한결과값인 < 표 4> 를보면적합도와는반대로모든연도및성별에대해서 100보다작게나온것을알수있다. 이는적합도와는달리평활도에서는 Beers의보정계수를이용한보정방법이 9차항의보정방법보다더좋다는것을나타내는것이다. 즉적합도부분에서는 9차항이 Beers의보정계수를이용한방법보다는월등하게뛰어나지만평활도에대해서는반대로 Beers의방법이월등히뛰어나다는것을알수있다. 2. Grevi l l e 차항보정방법의사망확률보정결과비교 앞에서설명했듯이 보정식은현재통계청에서사용하고있는 9차항뿐만아니라 5차, 7차, 11차, 13차등 차항을가진여러개의보정식으로나타낼수있다. < 그림 6> 과 < 그림 7> 은원자료를이용한 2007년남자와여자의사망확률에대해각각 5차, 7차, 9차, 11차, 13차의보정식을적용하여구한보정된사망확률을그래프로나타낸것이다. 앞의그림과마찬가지로가로축은연령을나타내며세로축은로그사망확률을나타낸다. < 그림 6> 과 < 그림 7> 을보면알수있듯이 9차항보정식뿐만아니라 5차, 7차, 11차, 13차 보정식모두원자료의사망확률추세를잘따라가면서보정해주는것을알수있다.
< 그림 6 > G r e v i l l e 항보정식을이용한 2 0 0 7 년남자로그사망확률 < 그림 7 > G r e v i l l e 항보정식을이용한 2 0 0 7 년여자로그사망확률 그러나 G rev i lle 1 3 차항보정식의경우다른보정식에비해사망
확률을낮게보정해주는것을볼수있다. < 표 5> 와 < 표 6> 은 5.1절의 Beers의보정계수를이용한보정방법을 9차항보정식과비교했던것처럼 차항의보정방법을원자료에적용하여적합도와평활도를비교한표이다. 5.1절에서와같이모든결과값은 9차항을기준으로계산되어진것이며보정방법의좋고나쁨을보는방법또한 5.1절의방법과같다. < 표 5 > G r e v i l l e 차항보정방법을이용한보정된사망확률과원자료사망확률에대한 M S E 비율 2000 2001 2002 2003 2004 2005 2006 2007 5차 70% 47% 104% 54% 58% 70% 54% 53% 남 7차 100% 78% 101% 86% 90% 95% 86% 94% 자 11차 110% 128% 107% 113% 107% 104% 113% 107% 13차 569% 1351% 829% 1777% 625% 590% 913% 583% 5차 53% 15% 77% 76% 60% 53% 25% 47% 여 7차 81% 50% 89% 97% 84% 88% 58% 89% 자 11차 113% 144% 122% 112% 121% 112% 141% 121% 13차 956% 1211% 1553% 1313% 1135% 870% 1207% 2120% 5차 63% 26% 90% 73% 68% 60% 33% 56% 전 7차 89% 60% 96% 98% 89% 91% 69% 99% 체 11차 111% 137% 115% 116% 119% 109% 132% 109% 13차 970% 1954% 1623% 1710% 1236% 907% 1432% 1636% 주 : 결과 값 : 의 MSE / 9차 MSE
< 표 5> 는원자료를이용한사망확률에대해서 차항의보정식을적용하여 MSE 를계산한다음 9차항에대한 MSE 비를계산한결과값이다. 표를보면알수있듯이 7차항보정식의 2000 년과 2002 년남자를제외하면모든연도및성별에대해서 9차항보정식보다항이작으면 9차항에비해적합도가높은것을알수있다. 특히 13차항보정식은 9 차항보정식보다정확성이매우떨어지는것을알수 남자 여자 전체 < 표 6 > G r e v i l l e 차항보정방법을이용한보정된사망확률과원자료사망확률에대한 3 차차분값비교 5차 7차 11차 13차 5차 7차 11차 13차 5차 7차 11차 13차 2000 2001 2002 2003 2004 2005 2006 2007 154% 134% 131% 132% 148% 140% 153% 157% 116% 114% 109% 109% 109% 111% 114% 118% 95% 93% 93% 92% 92% 94% 92% 90% 98% 92% 93% 90% 92% 95% 94% 94% 129% 135% 128% 130% 128% 131% 136% 127% 112% 112% 110% 108% 109% 111% 113% 109% 93% 94% 95% 95% 94% 94% 92% 93% 92% 92% 95% 95% 95% 94% 93% 93% 134% 137% 128% 127% 134% 132% 134% 132% 114% 111% 109% 108% 109% 110% 111% 113% 93% 93% 93% 94% 94% 93% 92% 94% 92% 92% 92% 93% 93% 94% 92% 94% 주 : 결과값 : 의 3 차차분값 / 9 차 3 차차분값
있는데이는앞의 < 그림 6> 과 < 그림 7> 에서볼수있듯이 13차항보정식은원자료를이용한사망확률을낮게보정해주기때문에이러한결과가나왔다고할수있다. < 표 6> 은 9차항에대한 차항의 3차차분값의비를나타낸것이다. 앞의 < 표 5> 의결과값과는반대로 보정식의항이적을수록 3차차분비는 100보다크며항이많을수록 3차차분비는 100보다작은것을알수있다. 즉 < 표 5> 와 < 표 6> 의결과값을보면 보정식은 9차항보다항이작을수록적합도는좋아지지만평활도는떨어지는것을알수있으며 9차항보다항이많을수록적합도는떨어지지만평활도는좋아지는것을알수있다. 3. Beers 의보정방법과 항보정식을이용한기대여명비교 기대여명이란어떤연령에서생존하고있는자가앞으로생존할것으로기대된평균연수이다 ( 통계청, 2006). 생명표에의하여계산된기대여명은사망에관한전반적상태를보여주는요약지표로서그의미를파악하기가훨씬쉽기때문에매우중요한지표이다. 이러한기대여명은사망확률의값에따라값이달라지며사망확률은보정방법에따라결과값이달라지기때문에각각의보정방법에따라기대여명의값이다르게계산된다. 본논문의기대여명은통계청의 2006년생명표작성결과 에서제공한방법을이용하여계산하였다. 기대여명을계산할때사용한사망확률은 B e e rs 의보정계수를이용한보정방법을적용하여보정된사망확률과 G re vi l le 9 차항보정식을포함한 G re vi l le 항보정식을적용하여보정된사망확률을이용하였다. 또한앞에서이야기했듯이 0 세의사망확률은높은영아사망률로인해다른보정방법을이용하여보정을하기때문에본논문에서는 2006년통계청생명표에서제공한각연도의남자, 여자, 전체의 0세사망확률을
분석에사용하였다. < 표 7> 은남, 녀전체 2007년기대여명 (0-94세) 을정리한것으로사망확률보정방법에따라기대여명을제시하고있다. 연령 < 표 7 > 각보정방법에대한 2 0 0 7 년남녀전체기대여명 GREVILLE 5차 GREVILLE 7차 GREVILLE 9차 GREVILLE 11차 GREVILLE 13차 BEERS 보정방법 0 79.25301 79.25313 79.25337 79.25376 80.11751 79.28464 1 78.58107 78.58119 78.58143 78.58182 79.44915 78.61283 2 77.61245 77.61187 77.61143 77.61114 78.47531 77.63766 10 69.72062 69.72082 69.72113 69.72144 70.57359 69.74134 11 68.72775 68.72803 68.7284 68.72883 69.57998 68.74915 16 63.7801 63.78028 63.78091 63.78172 64.62743 63.80157 18 61.82003 61.82003 61.82035 61.82074 62.66338 61.84031 19 60.84348 60.84341 60.84335 60.8433 61.68431 60.86289 20 59.8673 59.86727 59.86697 59.86688 60.70659 59.88689 26 54.0387 54.03932 54.03953 54.03962 54.86993 54.05832 27 53.07213 53.0719 53.07187 53.07186 53.90005 53.08959 28 52.10393 52.10361 52.10339 52.10339 52.92997 52.12131 30 50.16471 50.16517 50.16578 50.16654 50.9897 50.18597 43 37.73073 37.73104 37.73118 37.7318 38.51443 37.7521 45 35.87526 35.87569 35.87619 35.87659 36.65015 35.89825 47 34.04037 34.04009 34.03999 34.04006 34.80429 34.06316 65 18.42122 18.41773 18.41578 18.41477 19.0352 18.44448 66 17.62339 17.62324 17.62335 17.62267 18.23037 17.64995 74 11.72505 11.72569 11.72523 11.72458 12.21268 11.72391 75 11.05118 11.0514 11.05215 11.05316 11.52578 11.05648 76 10.40019 10.40028 10.40168 10.40375 10.85656 10.40694 77 9.772922 9.774597 9.775937 9.776171 10.20668 9.778162 79 8.587641 8.58399 8.580713 8.577411 8.960132 8.587142 92 2.211302 2.213245 2.213576 2.213298 2.26718 2.205973 94 0.889701 0.889856 0.889871 0.890019 0.898536 0.882752 < 표 8 > 은 B e e rs 의보정계수를이용한보정방법을적용하여보정된사망확률과 항보정식을적용하여보정한사망확률을이용하여계산된기대여명표이다. 표에서볼수있듯이
< 표 8 > 각보정방법을적용한 0 세기대여명 ( 평균수명 ) 남자여자전체 2000 2001 2002 2003 2004 2005 2006 2007 5차 72.346 73.042 73.464 73.922 74.380 74.935 75.524 75.958 7차 72.346 73.042 73.464 73.922 74.380 74.935 75.524 75.958 9차 72.347 73.042 73.465 73.922 74.380 74.935 75.525 75.958 11차 72.347 73.043 73.465 73.922 74.380 74.936 75.525 75.958 13차 73.342 74.023 74.433 74.887 75.331 75.878 76.454 76.887 Beers 72.345 73.014 73.479 73.936 74.413 74.948 75.510 75.987 5차 79.552 80.159 80.292 80.710 81.184 81.499 82.023 82.311 7차 79.552 80.159 80.292 80.710 81.184 81.500 82.023 82.311 9차 79.552 80.160 80.293 80.711 81.184 81.500 82.023 82.312 11차 79.553 80.160 80.293 80.711 81.184 81.500 82.023 82.312 13차 80.379 80.967 81.106 81.509 81.966 82.278 82.786 83.073 Beers 79.556 80.137 80.321 80.754 81.199 81.529 82.011 82.344 5차 76.036 76.697 76.981 77.419 77.886 78.337 78.896 79.253 7차 76.036 76.697 76.981 77.419 77.886 78.337 78.896 79.253 9차 76.037 76.697 76.981 77.420 77.886 78.337 78.896 79.253 11차 76.037 76.697 76.982 77.420 77.886 78.338 78.896 79.254 13차 76.972 77.615 77.895 78.323 78.775 79.218 79.762 80.118 Beers 76.039 76.672 77.003 77.449 77.909 78.358 78.882 79.285 차보정식은모든연도및성별에서 9차항을기준으로항이작을수록기대여명은상대적으로작게나타나지만항의개수가많으면기대여명은상대적으로높게나타나는것을볼수있다. 또한 Beers의보정계수를이용한보정식을이용하
여계산된기대여명은 G rev i lle 9 차항을이용하여계산된기대여명보다는높게나타나는것을알수있으며대부분의연도및성별에서 G rev i lle 1 3 차항보정식을적용하여계산된기대여명을제외하고는나머지 차항보정식보다는기대여명이높게나타나는것을볼수있다. Ⅵ. 결론 본논문에서는사망확률을보정하는방법중통계청에서사용하고있는 보정식과 NCHS에서사용하고있는 Beers의보정계수를이용한보정방법에대하여비교하였다. 구체적인비교방법은통계청과통계청 KMDSS에서제공한 0세-94세까지각세별주민등록인구및사망자수를이용하여원자료의사망확률을계산한후각각의사망확률보정방법을적용하여적합도및평활도를비교및평가하였다. 실증분석결과적합도부분에서는 9차항보정식이 Beers의보정계수를이용한보정방법보다월등히뛰어난것을알수있었으며평활도부분에서는반대로 B e e rs 의보정계수를이용한보정방법이 G re v ille 9 차항을이용한보정방법보다뛰어나다는것을알수있었다. 현재우리나라의사망확률은변동이크지않기때문에 Beers의보정계수를이용한보정방법보다는 G re vi lle 9 차항보정식을사망확률보정방법으로사용하는것이더적절할것이다. 따라서현재통계청에서사용하고있는사망확률보정방법은우리나라현실에알맞은보정방법이라고생각된다. 또한 보정식은통계청에서사용하고있는 9차항뿐만아니라 5차, 7차, 11차, 13차등 항을가진식으로나타낼수있
다. 이러한 Grevile 항의보정식에대해적합도와평활도를비교한결과 보정식은 9차항을기준으로하여항의수가많을수록적합도는떨어지지만반대로평활도는더좋아지는것을알수있다. 앞에서이야기했듯이우리나라의사망확률은변동이심하지않기때문에평활도는 9차항보다는조금떨어지지만적합도가높고말단값문제가적은 7차항보정식을사망확률보정방법으로사용하는것도한방법이라는것을제안할수있다. 마지막으로각각의보정방법을적용하여기대여명을계산한결과 9차항보정식을이용하여보정된사망확률을통해계산된기대여명이 B ee rs 의보정계수를이용한보정방법을이용하여보정된사망확률을통해계산된기대여명보다낮게나타나는것을알수있었다. 특히 Beers의보정계수를이용하여계산된기대여명은 13차항을제외하고는모든 차항보정식보다높게계산된것을확인할수있었다. 이는 NCHS가통계청보다기대여명이방법론적으로높게나온다는것을의미한다. 즉방법론상의차이로기대여명이낮게계산되는문제를고려한다면 G re vi lle 9 차항보정식보다는 B ee rs 의보정계수를이용한보정방법이나 11차항보정식을사용하는것도한방법이라는것을제안할수있다.
참고문헌 구자흥 (2002), 인구통계학의 이론과 실제, 교우사. 김기환 이동희 정승환 (2006), 간이생명표 확장 기법을 통한 사 망확률 추정, 한국 자료분석학회, 8(3): 959-969. 김기환 정승환 (2006), 우리나라 생명표의 연령구간 확장 및 기대 여명 예측, 한국 자료분석학회, 8(5): 1723-1733. 김성훈 (2008), 사망률 계산을 위한 기초자료 보정방법에 관한 연 구, 고려대학교 석사학위논문. 박유성 (2005), 사망률 예측을 위한 모형 비교, 응용통계연구, 18(3): 639-654. 보험개발원 (1992), 보정기법. 통계청 (2008), 2006년 생명표 작성결과. (2008), 2008년 고령자 통계. 통계교육원 (2008), 인구통계 기초와 응용. 통계정보시스템, http://kosis.kr Beers, H. S.(1944), Six-Term Formulas for Routine Actuarial Int erpo lat i on, American Institute of Actuaries, Vol. 33, Part II, No. 68, 245-260. Shiu, E. S. W.(1984), MINIMUM-Rz MOVING-WEIGHTED-AVERAGE FORMULAS, ARCH, Chicago: Society of Actuaries, Vol. 36. Eric, S. Seah.(1988), Algorithms for MWA Graduation Formulas ARCH, Chicago: Society of Actuaries, Vol 2. Gerritson, P.(1971), A New Class of Moving-Weighted-Average Graduation Formulas ARCH, Chicago: Society of Actuaries, Vol. 1., T.N.E.(1945), Actuarial Note : Some Extensions of Mr. Beers's Method of Interpolation, American Institute of Actuaries, Vol. 34, Part I, No. 69, 21-34.
T.N.E.(1981), Moving-Weighted-Average Smoothing Extended to the Extremities of the Data. 1. Theory, Scandinavian Actuarial Journal, 39-55. T.N.E.(1981), Moving-Weighted-Average Smoothing Extended to the Extremities of the Data. II. Methods, Scandinavian Actuarial Journal, 65-81. T.N.E.(1981), Moving-Weighted-Average Smoothing Extended to the Extremities of the Data. lii. Stability and. Optimal Properties, Journal of Approximation Theory, XXXIII, 43-58. London, R. L.(1981), In Defense of Minimum-Ro Linear Compound Graduation, and a Simple Modification for its Improvement, ARCH, Chicago: Society of Actuaries, 75-88. Miller, M. D.(1946), Elements of Graduation. New York: Actuarial Society of America and American Institute of Actuaries. National Center for Health Statistics.(1999), Method for Constructing Complete Annual U.S. Life Tables, Series 2, No. 129, Washington: Government Printing Office. National Center for Health Statistics.(2008), United States Life Tables, 2004, Vol. 56, No. 9, Washington: Public Health Service. Nesselle, D.(1965), A Least Squares Method for Determining the Makeham Constants, (unpublished Master's paper) Boston : Northeastern University. United Nations Population Fund.(2008), State of World Population 2008. Whittaker, E. T. and Robinson, G.(1944), The Calculus of Observations, 4th ed. London and Glasgow : Blackie and Son, Ltd.