< 방법론단신 > 중재메타분석 : R을활용한적용과실제 Intervention Meta-analysis: Application and Practice using R software 심성률 1,2, 김성장 3,4,5 1 고려대학교의과대학예방의학교실, 2 순천향대학교서울병원비뇨의과학연구소, 3 부 산대학교의과대학핵의학과, 4 양산부산대학교병원, 의생명융합연구소, 5 양산부산대학교병원, 핵의학과 Sung Ryul Shim, MPH, PhD 1,2, Seong-Jang Kim, MD, PhD 3,4,5 1 Department of Preventive Medicine, Korea University College of Medicine, Seoul, Korea, 2 Urological Biomedicine Research Institute, Soonchunhyang University Hospital, Seoul, Korea, 3 Department of Nuclear Medicine, College of Medicine, Pusan National University, Yangsan, Korea, 4 BioMedical Research Institute for Convergence of Biomedical Science and Technology, Pusan National University Yangsan Hospital, Yangsan, Korea, 5 Department of Nuclear Medicine, Pusan National University Yangsan Hospital, Yangsan, Korea 교신저자 : 심성률 sungryul.shim@gmail.com 서울시성북구안암로 145 1
Abstract The objective of this study was to describe general approaches of intervention metaanalysis that are available for quantitative synthesis of data using R software. We conducted an intervention meta-analysis using two types of data that included difference in means in continuous data and odds ratio in binary data. The package commands of R software were metacont, metabin, and metagen for overall effect size, forest for forest plot, metareg for meta-regression analysis, and funnel and metabias for publication bias. The estimated overall effect sizes, test for heterogeneity and moderator effect, and the publication bias were reported using R software. Especially authors stressed how to calculate effect sizes of target studies in intervention metaanalysis. This study focused on the practical methods of intervention meta-analysis rather than theoretical concepts for Korean researchers who were non-majored in statistics. Through this study, authors hope that many Korean researchers will use R software to perform an intervention meta-analysis more easily and that related research will be activated. Keywords: Meta-analysis, Meta-regression, Forest plot, Heterogeneity, Publication bias, R software. 2
서론 메타분석 (meta-analysis) 은체계적 객관적으로대상문헌을선택한후개별연구들의 결과를계량화하여이를통합된효과크기 (effect size) 로제시함으로서근거기반의료 (evidence based medicine; EBM) 를위한올바른의사결정을할수있게한다 [1,5]. 메타분석을보다쉽게접근하기위한컴퓨터소프트웨어는 STATA, R, SAS, MIX, CMA, RevMan, Meta-Analyst 등이있다. RevMan(Review Manager) 과 CMA(Comprehensive meta-analysis) 는그래픽사용자입력방식으로초보자가이용하기에적합하지만확장성은제한적이어서 special topic 인네트워크메타분석, 진단검사메타분석, 용량-반응메타분석, 유전체메타분석등은불가능하다. 반면 R과 STATA 는확장성이좋아현재까지개발되어진중재메타분석에서부터진단검사메타분석에이르기까지다양한분석이가능하다. STATA 는상용프로그램이며뛰어난확장성과더불어대부분의통계모듈들이 STATA 저널에서검증을거치기에표준적이고신뢰할수있다. R은무료프로그램이며기본적으로통계전공자를위한프로그래밍언어를사용하기때문에이를구현하기에는상당한학습이필요하지만메타분석같은특정도구로서의 R은기초적인패키지사용과데이터및함수설정방법정도만익힌다면누구라도쉽게이용할수있다. 더욱이 R studio를같이설치한다면그래픽사용자입력방식을지원하기에매우편리하다. 본연구는저자가수행했던메타분석선행연구들을 [1-3] R 소프트웨어를이용해서 다시풀어낸것이다. 또한본연구는종합효과크기계산을위한효과크기의유형과 3
변경부터다룰것이기때문에메타분석을실시하기위한선행과정들 PICO(population, intervention, comparison, outcome) 에기초한체계적문헌수집, 데 이터추출, 그리고질 (quality assessment) 평가에대한사전지식이수반되어야한다. 효과크기의이해 메타분석을수행하려면가장먼저효과크기에대한이해가필요하다. 간단히말하자면효과크기란특정중재 (intervention) 에따른효과를나타낸다. 예를들어특정약물또는치료가투입되었다면이로서얻게되는이익 ( 또는손해 ) 을말하며통상적으로양적수치로표현한다 [1]. 연속형자료 (continuous data) 에서는평균의차이 (MD, difference in means), 이분형자료 (binary data) 또는생존형자료 (time to event data) 에서는위험도비 (odds ratio, relative risk, 또는 hazard ratio), 그리고유병률자료 (proportion or rate data) 에서는백분율 (percentage) 형태로효과크기 (effect size) 가표현된다. 그러나일반적으로보건의료메타분석에서는치료에따른직접적인효과크기를주요하게판단하기때문에변수간의상관성을나타내는상관계수 (correlation coefficient, r) 는효과크기로잘쓰여지지않고있다. 위험도비의형태와백분율은이미자료들간의표준화가이루어져있기때문에이를효과크기그대로사용하여도큰문제는없다. 그러나연속형변수의경우평균의차이 (MD, difference in means) 를효과크기로사 용하게되는데이때는효과크기의표준화를고려해주어야한다. Cochrane 에서는 MD(mean difference) 또는 difference in means 로지칭하며개별연구들이동일한 4
단위 (scale) 일경우사용이가능하며단위그대로이해하면되기에해석이용이하다. WMD(weighted mean difference) 또는 absolute MD가동일한용어이다. 표준화된효과크기 SMD(standardized mean difference) 는개별연구들의단위가다를경우이들을표준화해야상호비교가가능하다. 표준화란효과크기를표준편차 (standard deviation) 로나누는것이다. Figure 1은 SMD의크기를잘표현하고있는데 SMD는표준정규분포곡선의 z값에해당하는확률밀도크기와동일하다. 예를들어 SMD가 1.96이면 0을중심으로양의방향으로 47.5% 에위치한다. 한가지주의할점은효과크기의방향에따라단방향으로해석해야한다. 왜냐하면참조그룹의기준점이 0이기때문이다. 따라서 SMD 가 1.96을다시해석하면 치료그룹은참조그룹대비 95% 우수 / 열등하다 의의미가된다. 1. 효과크기계산 본연구에서는메타분석를위해서기본적으로이해하고있어야할효과크기와표준오차계산을다루려고한다. 프로그램을사용해서분석해보면결국메타분석은원자료자체를넣어서계산할수도있으며또한요약된효과크기와표준오차로서도종합효과크기를구할수있다는것을알수있다. 이처럼개별연구에서의효과크기와표준오차를계산하는것은매우중요한부분이며컴퓨터프로그램과더불어스스로계산할수있어야추후이어지는메타분석 special topic으로의확장된접근이가능하다. 1) 연속형예제자료 5
치료그룹과대조그룹이있을때, m1은치료그룹의치료전평균 (pre_mean1) 과치료후평균 (post_mean1) 평균의차이이며 m2는대조그룹의전 / 후평균차이이다. 따라서 s1과 s2는각 m1과 m2의표준편차이다. md는단순히치료그룹과대조그룹평균의차이이며 (m1-m2; 평균차이의방향은연구자가의도하는방향으로설정 ), 공통표준편차 (pooled standard deviation, sd) 와공통표준오차 (pooled standard deviation, se) 는아래수식으로계산한다. sd = (n 1 1)s 1 2 + (n 2 1)s 2 2 n 1 + n 2 2, se = s d 1 n 1 + 1 n 2 표준화된효과크기 SMD는 md를공통표준편차로 (sd) 나누어준것이며 (SMD = md / sd), SMD의표준오차 (se) 는공통표준편차 (sd) 에각표본수의역수를합산한제곱근을곱한것이다. 이때만들어지는 SMD는 Cohen의 d이며표본수가적을경우종합효과크기 (overall effect size) 를과대추정하는경향이있는데이를보정해주기위해서 Hedges의 g를사용하기도한다. 2) 이분형예제자료 이분형예제자료는처치의유무와질병개선의유무에따라흔히 2 2 테이블형태로표시한다. 이때처치가있으면서질병개선됨 (true positive, tp), 처치가있으면서질병이개선안됨 (false positive, fp), 처치가없으면서질병이개선됨 (false negative), 처치가없으면서질병이개선안됨 (true negative, tn) 이라고하면효과크기 OR(odds 6
ratio) 과표준오차 (se) 는아래수식으로계산한다. OR = (tp tn) (fp fn), se = 1 tp + 1 fp + 1 fn + 1 tn R 의 meta 패키지를이용한중재메타분석 Figure 2는일반적인중재메타분석의흐름을나타낸다. 최초자료코딩시해당함수에적합하도록변수명을수정해야하며메타분석모델선정 (Fixed or Random) 으로종합효과크기를제시하고 -> 이질성을확인한다음 -> 출판편향을확인해서보고한다. R 에서메타분석을실시하는패키지는크게 meta, metafor, 그리고 rmeta 가있 다. 서로간의장단점이있으며필요한함수를쓸수있으니미리설치한다 [6]. install.packages("meta") install.packages("metafor") install.packaqes("rmeta ) 주요설명은실행하기쉬운 meta 패키지를중심으로기술한다. 본문과의구분을위하여명령어앞에는 으로표시하였다. 명령어가길어져서다음 줄로넘어가더라도 없으면앞의줄에서이어지는것이다. 따라서실제 R 프로그 램에입력시에는 는제외하고타이핑하여야한다. 1. 연속형 (continuous data) 예제자료 1) 데이터코딩및불러오기 7
척수손상동물모델에서줄기세포치료에따른방광기능효과를메타분석한연구로서결과지표는배뇨압력 (voiding pressure) 을예제로사용하였다. 전체연구수는 11개였고실험군 94개와대조군 93개로이루어졌다. subgroup 1은 contusion model 그리고 0은 transection and hemisection model로구분하였다 (Supplementary Material 1). 메타분석을실행하기위해 meta 패키지를로딩시킨다. library(meta) 다음은작업폴더에넣어둔예제파일을아래의명령어로 R의메모리에불러온다. 한가지주의할점은 R에서는쉼표로구분된수치파일 (csv) 의형태를선호하니 Appendix 1을 shim_con.csv 포멧으로저장해서지정된작업폴더에넣어두어야한다. data_con <- read.csv("shim_con.csv", header=true) read.csv는 csv파일을불러오는함수로서파일명 shim_con.csv" 를불러와서파일의첫번째변수명을그대로쓴다는뜻이다 (header=true). 이렇게로딩된파일은 R 메모리에서는 data_con 이름의데이터로저장된다. 2) 종합효과크기 meta 패키지는하위에여러함수들을포함하는데그중 metacont 함수는연속형자 료에서원자료들이모두있을때종합효과크기를계산한다. ma_con <- metacont(n1, m1, s1, n2, m2, s2, sm="smd", method.smd=" Hedges", study, byvar=g,data=data_con) print(ma_con, digits=3) 8
연속형자료에서는치료그룹과대조그룹 ( 혹은원하는방향대로반대로입력 ) 의표본 수, 평균, 표준편차를각각차례대로넣어준다. 개별연구들의단위가동일하여효과크기를표준화하지않고계산하려면 smd= MD 로입력하면된다. 그러나통상적으로는표준화된효과크기는 SMD 로표시하며 SMD 를산출하는방법은여러가지가있다. 가장기본적인방법은효과크기를공통 표준편차로나누어주는 Cohen 의 d 를말하는것으로표본수가적을경우종합효과 크기가과대추정되는경향이있으므로이를교정해주는 Hedges 의 g 를사용하는것 이바람직하다 (method.smd= Hedges 또는 Cohen ). 참고로 Hedges 의 g 는교정지 수 J를 Cohen의 d에곱하여계산한다. 3 J = 1 4(n 1 + n 2 ) 9 Fixed 또는 Random effect model 의설정을위해서는 comb.fixed=true 또는 FALSE, comb.random= TRUE 또는 FALSE 를추가해서입력한다. 만약모형설정을하지않는 다면 metacont 함수에서는두모형의결과를모두제시한다. study 는개별연구들의이름을나타내며 data=data_con 은 R 메모리에로딩된 data_con 이라는데이터를지정해주는것이다. subgroup 별결과를나타내려면 byvar=g 를입력하는데 g 는 subgroup 을나타내는변수명이다. metacont 함수를사 용해서나온결과들은 ma_con 에지정되며결과는 Figure 3 이다. ma_con 에서나온결과들을 Figure 3 에서하나씩살펴보자. 1 은전체 11 개연구의종합효과크기를나타낸다. Fixed effect model 의 SMD 는 - 1.456 (95%CI; -1.832, -1.081) p-value <0.0001 이하로서해당처치가통계적으로유의 9
하게개선되는결과를나타내었다. Random effect model의 SMD는 -1.973 (95%CI; - 2.897, -1.048) p-value <0.0001이하로서동일한결과를나타낸다. 2와 3은 subgroup에해당하는결과를 Fixed or Random effect model로서나타낸것이다. Random 모델에서는 subgroup(0 vs 1) 에따른차이가의심된다. 4는전체연구의이질성 (heterogeneity) 를나타낸것이다. 이질성의 Higgins I 2 는 Cochrane Q statistics에서자유도 (degree of freedom) 를뺀것을다시 Cochrane Q statistics으로나누어준값으로이질성을일관성있게정량화시킨다. 0% 에서 40% 는이질성이중요하지않을수있으며 (might not be important), 30% 에서 60% 는중간이질성 (moderate heterogeneity), 50% 에서 90% 는중대한이질성 (substantial heterogeneity), 그리고 75% 에서 100% 는심각한이질성 (considerable heterogeneity) 을나타낸다. Cochrane Q statistics의 p-value는조금폭넓게 0.1을유의성판단기준으로한다 [4]. 본연속형예제자료의 Higgins I 2 는 82.7% 이며 Cochrane Q statistics p-value <0.0001 이하로서이질성이존재한다는것을알수있다. 따라서전체적인모델은 Random effect model을우선하여야한다. 그외 Figure 3 하단에해당결과가어떤계산방법으로도출되었는지보여주고있다. Inverse variance method는메타분석의기본적인방법으로서개별연구들의가중치를계산할때해당연구의역분산을활용한다. DerSimonian-Lair estimator는 Random effect model에서연구간변량을계산할때 tau값을계산하는방법이며, Hedges g는현재의결과값은 Cohen s d를보정한 Hedges의 g를사용하였다는것이다. 세부적인계산방법은 meta 패키지를참조하면서임의대로자유롭게설정할수있 10
다. Forest plot( 숲그림 ) Figure 3 은상세한정보파악은좋으나전반적인식별력이떨어진다. 따라서 forest plot 을작성해줌으로서독자들의이해도를향상시킬수있다 (Figure 4). forest(ma_con, comb.fixed=true, comb.random=true,digits=3,rightcols=c("effect", "ci")) forest 함수에해당설정된메타분석모델 (ma_con) 을입력한다. 그런다음다양한옵션들을넣어주어그림을예쁘게만들어준다. comb.fixed=true와 comb.random=true는두모형을다표시하라는것이며, digits=3은소수점세자리까지만표시, rightcols=c( effect, ci )) 는 forest plot 오른편에는원래는 weight가표시되는데이를생략하고효과크기와신뢰구간만을보여주라는뜻이다. Figure 4는앞의종합효과크기와동일한정보를제공한다. 더불어개별연구들의효과크기를그래픽으로제시함으로써연구내변동과연구간변동을쉽게파악할수있도록해준다. 예를들어연구내변량이큰것은 Mitsui2005_a 그리고 Mitsui2003인것을알수있고연구간변량이큰것은 Mitsui2005_a, WBPark2010_1 그리고 WBPark2010_2 인것을알수있다. 3) 이질성 (heterogeneity) 메타분석에서얻어낸종합효과크기를제대로해석하려면연구들간의이질성유무 를확인하고만약유의한조절변수 (moderator) 가있다면이를검정하고보고하여야 11
한다. 이러한이질성의원인은우연 (chance), 연구설계 (study design) 의차이, 연구환 경, 그리고표본집단의인구사회학적요인에이르기까지매우다양하다. (1) 시각적확인 : forest plot & subgroup analysis 이질성을탐색하기위해연구내변동과연구간변동을시각적으로쉽게확인할수 있다. (2) 이질성측정 : Higgins I 2 & Cochrane Q statistics Figure 3 을설명한면서연구의이질성을상세설명하였고이질성의정도를수치화해 서나타내며더불어통계적검정도보여준다. (3) 이질성원인파악 : meta-regression Forest plot을이용한시각적확인과 Cochrane Q statistics와 Higgins I 2 이용한이질성수치로부터이질성이의심된다면이질성의원인을통계적으로검정하기위한파악하기위하여메타회귀분석을실시한다. metareg(ma_con,g, method.tau="reml", digits=3) metareg 함수에설정된메타분석모델을넣어주고, 메타회귀분석에가중치를부여하는방법에따라 method.tau= REML (restricted maximum-likelihood estimator or ML (maximum-likelihood estimator), DL (DerSimonian-Laird estimator) 등을선택한다. 가중치계산방법에따른수치의변화는있지만대부분의통계적방향성은동일하니너무주의를기울이지않아도무방하다. Random effect model을기준으로 subgroup 1의종합효과크기는 -2.139(95%CI; - 3.410, -0.867) 그리고 subgroup 0의종합효과크기는 -1.610(-2.413, -0.808) 로해당변수가조절변수 (moderator) 로의심되었으나메타회귀분석결과 p-value = 0.711 로 12
통계적으로유의한차이를나타내지는않았다. bubble(metareg(ma_con, g, method.tau="reml")) 메타회귀분석결과를 Figure 5에서와같이도식화해서나타낼수있다. 그래프상의직선은회귀직선을나타내며그기울기에대한통계적검정이앞서실시한메타회귀분석의 p-value이다. 4) 출판편향확인 (publication bias) 출판편향 (publication bias) 은개별연구들의특성과결과에따라연구가출판되거나출판되지않을오류이다. 일반적으로통계적유의한연구결과일경우더욱출판될가능성이높기때문에발생하는데, 이러한출판편향을고려하여해당메타연구의결과가과대또는과소추정되지는않았는지확인하여야한다. (1) 시각적확인 : funnel plot 출판편향을탐색하기위해연구들간의비대칭성이존재하는지시각적으로확인하여 야한다 (Figure 6). funnel(ma_con, comb.fixed=true, comb.random=false) funnel 함수에설정된메타분석모델을넣고, comb.fixed=true 또는 FALSE, comb.random= TRUE 또는 FALSE 를추가해서입력한다. Funnel plot 의 Y 축은표본크기 ( 표준오차 ) 를 X 축은효과크기를제시한다. 일반적으로 작은규모의연구들은아래쪽에넓게분포되며큰규모의연구들은깔때기안상단 에좁게분포된다. 따라서깔때기안상단에좌우대칭으로골고루분포되어있다면 13
출판편향은적다고판단할수있다. 연속형예제자료는깔때기바깥좌측으로 3개, 우측으로 2개의연구가, 깔때기안좌측으로 4개, 우측으로 2개의연구가분포한다. 시각적으로판단하기에출판편향이있을것으로판단된다 (Figure 6). (2) 출판편향통계적검정 출판편향을통계적으로검정하는일반적인방법은 Egger s linear regression method test (Egger s test) 그리고 Begg and Mazumdar s rank correlation test (Begg s test) 가있다. Egger s test가 Begg s test보다효과크기의실제추정치를더정확히추정한다고보고하고있다. 그러나통계적검정은출판편향의영향보다는연구의수가적을경우 (small study effect) 이를정확히검정하지못하므로 Cochrane에서는권고하지않는다. Egger s linear regression method test 중재효과의표준오차에대한개별연구들의효과크기관계를회귀식으로나타낸것 으로귀무가설은회귀식의초기값 (intercept) 은우연에의한결과로서출판편향이있 음을증명할수없다는것이다. ma_con <- metacont(n1, m1, s1, n2, m2, s2, sm="smd", method.smd="hedges", study,data=data_con) metabias(ma_con, method.bias="linreg") 앞선종합효과크기계산에서 subgroup 분석으로나누었기에 metabias 함수가실행 되지않을가능성이크다. 따라서전체연구를대상으로다시한번종합효과크기를 계산한다음바로이어서 metabias 함수를사용한다. metabias 함수에설정된메타 분석모델과 Egger s test 를실행하는 method.bias="linreg" 옵션을추가한다. 14
연속형자료의경우 bias 항목의 Coef. 가 -9.23 으로초기값 (intercept) 을나타내며해 당 p-value <0.0001 로써귀무가설을기각하여출판편향이있음을확인할수있다. Begg and Mazumdar s rank correlation test 개별연구들의표준화된효과크기와표준오차와의상관관계를보정된순위상관 (rank correlation) 으로검정한다. 순위상관검정이유의하지않다면출판편향이없음 을나타낸다. metabias(ma_con, method.bias="rank") metabias 함수에설정된메타분석모델과 Begg s test를실행하는 method.bias="rank" 옵션을추가한다. Egger s test 결과와마찬가지로 p-value = 0.0024로서출판편향이있음을알수있다. 이처럼출판편향이통계적으로유의할때는출판편향이의심되는연구들을포함또는제외하여종합효과크기를다시한번확인할필요가있다. 즉, 출판편향에대한민감도분석 (sensitivity analysis) 을실시하여해당연구들의특성을보고하고이질성이발견된다면메타회귀분석을통해서통계적검정도실시하여야한다. 2. 이분형 (binary data) 예제자료 메타분석을실행을위한명령어는연속형예제자료와대부분동일하므로차이가있 는부분을중심으로설명하겠다. 1) 데이터코딩및불러오기 15
전체연구수는 6개였고전체표본수는 1,380으로이루어졌다. g는 subgroup 분석을위해임의로 0과 1을설정하였다 (Supplementary Material 1). Supplementary Material 1의 hwang_bin.csv 포멧으로저장해서지정된작업폴더에넣어두어야한다. data_bin <- read.csv("hwang_bin.csv", header=true) 2) 종합효과크기 meta 패키지는하위에여러함수들을포함하는데그중 metabin 함수는이분형자 료에서원자료들이모두있을때종합효과크기를계산한다. ma_bin <- metabin(tp,tp+fp,fn,fn+tn, sm="or", method ="Inverse", study, byvar=g, data=data_bin) print(ma_bin, digits=3) 이분형자료에서는 tp, tp+fp, fn, fn+tn을각각차례대로넣어준다. 효과크기를 OR 또는 RR로표시하고싶으면 sm= OR 또는 RR 로설정한다. 개별연구들의가중치를설정하는방법이다수있는데일반적인 inverse variance method 를사용하려면 method= Inverse 를입력한다. metabin 함수를사용해서나온결과들은 ma_bin에지정되며 Figure 7에서하나씩살펴보자. 1은전체 6개연구의종합효과크기를나타낸다. Fixed effect model의 OR는 2.063 (95%CI; 1.526, 2.789) p-value <0.0001이하로서동아리활동이취업에통계적으로유의하게영향을미치는결과를나타내었다. Random effect model의 OR은 1.762 (95%CI; 1.103, 2.813) p-value = 0.0177로서동일한결과를나타낸다. 16
2와 3은 subgroup에해당하는결과를 Fixed or Random effect model로서나타낸것이다. Random 모델에서는 subgroup(0 vs 1) 에따른차이가의심된다. 4는전체연구의이질성 (heterogeneity) 를나타낸것이다. 본이분형예제자료의 Higgins I 2 는 52.6% 이며 Cochrane Q statistics p-value = 0.061 로서이질성이있음을알수있다. 그외 Figure 7 하단에해당결과가어떤계산방법으로도출되었는지밝히고있다. Inverse variance method는메타분석의기본적인방법으로서개별연구들의가중치를계산할때해당연구의역분산을활용한다. DerSimonian-Lair estimator는 Random effect model에서연구간변량을계산할때 tau값을계산하는방법이다. 세부적인계산방법은 meta 패키지를참조하면서임의대로자유롭게설정할수있다. Forest plot( 숲그림 ) forest(ma_bin, comb.fixed=true, comb.random=true,digits=3,rightcols=c("effect", "ci")) forest 함수에해당설정된메타분석모델 (ma_bin) 을입력한다. 상세옵션설명은연 속형예제자료와동일하다. 3) 이질성 (heterogeneity) (1) 이질성원인파악 : meta-regression Forest plot을이용한시각적확인과 Cochrane Q statistics와 Higgins I 2 이용한이질성수치로부터이질성이의심된다면이질성의원인을통계적으로검정하기위한파악하기위하여메타회귀분석을실시한다. 17
metareg(ma_bin, g, method.tau="reml", digits=3) Random effect model을기준으로 subgroup 1의종합효과크기는 1.428(95%CI; 0.865, 2.357) 그리고 subgroup 0의종합효과크기는 2.542(1.743, 3.707) 로해당변수가조절변수 (moderator) 로의심되었으나메타회귀분석결과 p-value = 0.371 로통계적으로유의한차이를나타내지는않았다. 메타회귀분석을위해서는대상연구가최소 10개이상은있어야유의미한결과로해석할수있다. 그러나본이분형예제자료는전체연구의수가 6개로메타회귀분석에적절하지않고통계적유의차를나타내지못하였으나추후연구의수가추가된다면해당조절변수는유의하게영향을미칠것으로판단된다. 4) 출판편향확인 (publication bias) (1) 시각적확인 : funnel plot funnel(ma_bin, comb.fixed=true, comb.random=false) 이분형예제자료의 funnel plot을그려보면깔때기안좌측으로 4개, 깔때기바깥우측으로 1개의연구가분포한다. 시각적으로판단하기에출판편향이있을것으로판단된다. 따라서연속형예제에서실시하였던출판편향의통계적검정을이용하여고찰하기바란다. 3. 자료유형상관없이메타분석 18
지금까지연속형 (continuous data) 과이분형 (binary data) 의원자료에서종합효과크기와이와관련된이질성을평가하는방법을알아보았다. 그러나사실이러한자료에따른구분은사용자의편의를위해서명령어 ( 함수 ) 를구분해놓았을뿐개별연구들의효과크기와표준오차를이미알고있다면자료의유형에상관없이메타분석을실시할수있다. 1) 데이터코딩및불러오기 앞에서실행했던연속형 (continuous data, Appendix 1) 과이분형 (binary data, Appendix 2) 의원자료를불러오면효과크기와표준오차는이미변수로입력되어져 있다. data_con <- read.csv("shim_con.csv", header=true) data_bin <- read.csv("hwang_bin.csv", header=true) read.csv 함수로연속형과이분형자료를각각불러들여 R 메모리에서 data_con, data_bin 이름의데이터로저장한다. 2) 종합효과크기 meta 패키지는하위에여러함수들을포함하는데그중 metagen 함수는효과크기 와표준오차로서종합효과크기를계산한다. (1) 연속형자료효과크기와표준오차계산 ma_con_es <- metagen(cohen_d, cohen_se, sm="cohen(smd)", study, byvar=g, data=data_con) print(ma_con_es, digits=3) forest(ma_con_es, comb.fixed=true, comb.random=true, digits=3, rightcols=c("effect", "ci")) metagen 함수에효과크기에해당하는 cohen_d 와표준오차 cochen_se 를입력한다. 19
연속형자료의효과크기와표준오차로산출한메타분석모델이 ma_con_es에설정된다. 앞서실시한연속형예제자료에서 SMD 중 Cohen의 d를옵션으로 [method.smd="cohen ] 사용한다면지금산출한메타분석모델 ma_con_es과동일한효과크기를얻을수있다. (2) 이분형자료효과크기와표준오차계산 ma_bin_es <- metagen(lnor, orse, sm="or", study, data=data_bin) print(ma_bin_es, digits=3) forest(ma_bin_es, comb.fixed=true, comb.random=true, digits=3, rightcols=c("effect", "ci")) metagen 함수에효과크기에해당하는 lnor 과표준오차 orse 를입력한다. 이분형자 료의효과크기와표준오차로산출한메타분석모델이 ma_bin_es 에설정된다. 앞서실시한이분형예제자료의효과크기와동일함을알수있을것이다. 맺음말 본연구는통계학을전공하지않은일반연구자들도쉽게수행할수있도록통계학이론을최소화하여메타분석의실질적수행방법에집중하였다. 따라서본연구를참고하여메타분석을실행하고자하는연구자는반드시효과크기계산에대한개념정립을확고히하여야한다. 아울러국내연구자들이 R을이용한메타분석을보다쉽게수행함으로써관련연구가활성화되기를바란다. 20
References 1. Hwang SD & Shim SR. Meta-analysisp; from forest plot to network meta-analysis. Seoul: Hannarae publishing co.; 2018 (Korean). ISBN: 9788955662214 2. Shim SR. Intervention meta-analysis using R software. Gyeonggi-do: SDB Lab; 2019 (Korean). ISBN 979-11-965933-0-8 3. Shim SR, Shin IS, Bae JM. Intervention Meta-Analysis Using STATA Software. J Health Info Stat. 2016;41(1):123-134. 4. Higgins JPT, Green S. editors Cochrane handbook for systematic reviews of interventions. Version 5.1.0:6.4.1. 2011. The Cochrane Collaboration. Available from: http://www.cochrane-handbook.org. 5. Borensein M, Hedges LV, Higgins JPT, Rothstein HR. (2019). Introduction to Meta- Analysis.preface. West Sussex, UK: John Wiley & Sons Ltd.; p. 20-28. 6. R software "meta" packages. Available from: http://www.imbi.unifreiburg.de/lehre/lehrbuecher/meta-analysis-with-r/r-packages or http://metaanalysis-with-r.org/ 21
Figure legends Figure 1. Effect size of standardized mean difference. Figure 2. Flow chart of intervention meta-analysis using R "meta" package. 22
Figure 3. Overall effect size of continuous example. 23
Figure 4. Forest plot of continuous example. Figure 5. Meta-regression bubble plot of continuous example.. 24
Figure 6. Funnel plot of continuous example. 25
Figure 7. Overall effect size of binary example. 26