38 PARK 단순한형태의회귀식부터로그함수로의치환하거나다양한인자를고려할수있는복잡한회귀식까지다양하다 (Kronvang and Bruhn, 1996; Robertson and Roerish, 1999; Horowitz, 2003; Robertson, 2003; Coynel

Similar documents
10(3)-12.fm

03-서연옥.hwp

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

04김호걸(39~50)ok

DBPIA-NURIMEDIA

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

09권오설_ok.hwp

433대지05박창용

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

09È«¼®¿µ 5~152s

<C3D6C1BE2DBDC4C7B0C0AFC5EBC7D0C8B8C1F D32C8A3292E687770>

인문사회과학기술융합학회

유해중금속안정동위원소의 분석정밀 / 정확도향상연구 (I) 환경기반연구부환경측정분석센터,,,,,,,, 2012

<30312DC1A4BAB8C5EBBDC5C7E0C1A4B9D7C1A4C3A52DC1A4BFB5C3B62E687770>

DBPIA-NURIMEDIA

10(3)-09.fm

???? 1

02¿ÀÇö¹Ì(5~493s

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

03이경미(237~248)ok

Analysis of objective and error source of ski technical championship Jin Su Seok 1, Seoung ki Kang 1 *, Jae Hyung Lee 1, & Won Il Son 2 1 yong in Univ

05서찬양(521~529)ok

DBPIA-NURIMEDIA

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: : Researc

14.531~539(08-037).fm

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

Æ÷Àå82š

09오충원(613~623)

10(3)-02.fm

DBPIA-NURIMEDIA

<352EC7E3C5C2BFB55FB1B3C5EBB5A5C0CCC5CD5FC0DABFACB0FAC7D0B4EBC7D02E687770>

Rheu-suppl hwp

DBPIA-NURIMEDIA

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 27(12),

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Feb.; 29(2), IS

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: * Strenghening the Cap

<35335FBCDBC7D1C1A42DB8E2B8AEBDBAC5CDC0C720C0FCB1E2C0FB20C6AFBCBA20BAD0BCAE2E687770>

<31325FB1E8B0E6BCBA2E687770>

#Ȳ¿ë¼®

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A Research Trend

08김현휘_ok.hwp

<30345F D F FC0CCB5BFC8F15FB5B5B7CEC5CDB3CEC0C720B0BBB1B8BACE20B0E6B0FCBCB3B0E8B0A120C5CDB3CE20B3BBBACEC1B6B8ED2E687770>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 28(3),

???? 1

Lumbar spine

<31372DB9DABAB4C8A32E687770>

untitled

공휴일 전력 수요에 관한 산업별 분석

hwp

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: * A Analysis of

B-05 Hierarchical Bayesian Model을 이용한 GCMs 의 최적 Multi-Model Ensemble 모형 구축

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 6, Jun Rate). STAP(Space-Time Adaptive Processing)., -

<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED D2DB1E8C7F5C1D62E687770>

DBPIA-NURIMEDIA

09김정식.PDF

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: * Review of Research

<30312DC1A4BAB8C5EBBDC5C7E0C1A420B9D720C1A4C3A52DBDC5C1F82E687770>

DBPIA-NURIMEDIA

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A S

Journal of Educational Innovation Research 2017, Vol. 27, No. 1, pp DOI: * The

012임수진

<B8F1C2F72E687770>

<32382DC3BBB0A2C0E5BED6C0DA2E687770>

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: : * Research Subject

Æ÷Àå½Ã¼³94š

Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography, Vol. 33, No. 4, , 서론. (Heo, 2013). (Park et al., 2

Microsoft Word - KSR2016S168

책임연구기관

Journal of Educational Innovation Research 2017, Vol. 27, No. 3, pp DOI: (NCS) Method of Con

Journal of Educational Innovation Research 2017, Vol. 27, No. 4, pp DOI: * A Study on Teache

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: A study on Characte



에너지경제연구 Korean Energy Economic Review Volume 11, Number 2, September 2012 : pp. 1~26 실물옵션을이용한해상풍력실증단지 사업의경제성평가 1

Journal of Educational Innovation Research 2016, Vol. 26, No. 3, pp.1-16 DOI: * A Study on Good School

목차 ⅰ ⅲ ⅳ Abstract v Ⅰ Ⅱ Ⅲ i

DBPIA-NURIMEDIA

Æ÷Àå82š

08원재호( )

232 도시행정학보 제25집 제4호 I. 서 론 1. 연구의 배경 및 목적 사회가 다원화될수록 다양성과 복합성의 요소는 증가하게 된다. 도시의 발달은 사회의 다원 화와 밀접하게 관련되어 있기 때문에 현대화된 도시는 경제, 사회, 정치 등이 복합적으로 연 계되어 있어 특

DBPIA-NURIMEDIA

10(3)-10.fm

歯49손욱.PDF

에너지경제연구 제13권 제1호

untitled

DBPIA-NURIMEDIA

3. 클라우드 컴퓨팅 상호 운용성 기반의 서비스 평가 방법론 개발.hwp

분석결과 Special Edition 녹색건물의 가치산정 및 탄소배출 평가 이슈 서 민간분야의 적극적인 참여 방안의 마련이 필요하다. 또한 우리나라는 녹색건축의 경제성에 대한 검증에 대 한 연구가 미흡한 실정이다. 반면, 미국, 영국, 호주 등은 민간 주도로 녹색건축물

에너지경제연구 제12권 제2호

RRH Class-J 5G [2].,. LTE 3G [3]. RRH, W-CDMA(Wideband Code Division Multiple Access), 3G, LTE. RRH RF, RF. 1 RRH, CPRI(Common Public Radio Interface)

년AQM보고서_Capss2Smoke-자체.hwp

< C6AFC1FD28C3E0B1B8292E687770>

<484D53B0ADC0C72E687770>

Abstract Background : Most hospitalized children will experience physical pain as well as psychological distress. Painful procedure can increase anxie

DBPIA-NURIMEDIA

<3136C1FD31C8A35FC3D6BCBAC8A3BFDC5F706466BAAFC8AFBFE4C3BB2E687770>

에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 95~118 학술 탄소은행제의가정용전력수요절감효과 분석 1) 2) 3) * ** *** 95

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 25(3),

Transcription:

Korean Journal of Environmental Agriculture Korean J Environ Agric. 2014;33(1):37-43. Korean Online ISSN: 2233-4173 Published online 2014 February 7. http://dx.doi.org/10.5338/kjea.2014.33.1.37 Print ISSN: 1225-3537 Research Article Open Access 유전자알고리즘과회귀식을이용한오염부하량의예측 박윤식 1* 1 퍼듀대학교농공학과 Estimation of Pollutant Load Using Genetic-algorithm and Regression Model Youn Shik Park 1* ( 1 Department of Agricultural and Biological Engineering, Purdue University, West Lafayette in 47907, USA) Received: 22 January 2014 / Revised: 5 February 2014 / Accepted: 7 February 2014 Copyright c 2014 The Korean Society of Environmental Agriculture This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited. Abstract BACKGROUND: Water quality data are collected less frequently than flow data because of the cost to collect and analyze, while water quality data corresponding to flow data are required to compute pollutant loads or to calibrate other hydrology models. Regression models are applicable to interpolate water quality data corresponding to flow data. METHODS AND RESULTS: A regression model was suggested which is capable to consider flow and time variance, and the regression model coefficients were calibrated using various measured water quality data with genetic-algorithm. Both LOADEST and the regression using genetic-algorithm were evaluated by 19 water quality data sets through calibration and validation. The regression model using genetic-algorithm displayed the similar model behaviors to LOADEST. The load estimates by both LOADEST and the regression model using genetic-algorithm indicated that use of a large proportion of water quality data does not necessarily lead to the load estimates with smaller error to measured load. CONCLUSION: Regression models need to be calibrated and validated before they are used to interpolate pollutant * 교신저자 (Corresponding author): Youn Shik Park Phone: +1-765-491-5268; Fax: +1-765-496-1115; E-mail: park397@purdue.edu loads, as separating water quality data into two data sets for calibration and validation. Key words: Genetic-Algorithm, LOADEST, Pollutant Load Estimation, Regression Model 서론 강우시하천이나강으로유입되는비점원오염원은부영양화나수생태계의파괴등의원인중하나며, 이러한현상은자연적인현상일수도있으나농경지나도시화와같은인위적인요소도적지않은영향을끼친다 (Carey et al., 2011). 수질개선등의문제를해결하기위해서는이러한문제를해결하기위해서는비점원오염원을정량화하는것이필요하며이를위해수문모형등을이용할수있다 (Park et al., 2007). 수문모형을검증하기위해서는측정된수질자료를이용한보정및검정과정이필요하며, 오염부하량산정에있어서도장기적인수질자료가필요하다. 이러한수질자료의사용에있어유량자료가함께요구되나, 수질자료의측정은유량자료의측정에비해상대적으로많은시간과노력, 비용을요구하기때문에유량자료에비해측정빈도가낮다. 수질자료는월단위나주단위등과같이일정한간격으로측정되거나, 강우사상에기반을두거나, 혹은일정한간격과강우사상을함께고려하여측정된다 (King and Harmel, 2003). 측정빈도가낮은수질자료를보간하거나미계측지점에대한오염부하량을예측하기위해서회귀식이사용되고있으며, 37

38 PARK 단순한형태의회귀식부터로그함수로의치환하거나다양한인자를고려할수있는복잡한회귀식까지다양하다 (Kronvang and Bruhn, 1996; Robertson and Roerish, 1999; Horowitz, 2003; Robertson, 2003; Coynel et al., 2004; Johnes, 2007; Henjum et al., 2010). Load Estimator (LOADEST; USGS Report, 2004) 는유량자료와측정된수질자료를이용하여회귀식을보정하여, 수질자료가측정되지않은지점에대한오염부하량을산정할수있는프로그램이다. Carey 등 (2011) 은 1992년에서 2006 년동안의아질산염질소, 질산염, 총인의실측자료를통해 LOADEST를보정및검정한결과실측치에가까운예측치를모의하였다. 또한 LOADEST는부유유사 (Dornblaser and Striegl, 2009; Das et al., 2011), 총질소 (Oh and Sankarsaubramanial, 2011) 등의수질자료에대해이용된바있다. 이처럼 LOADEST는오염부하량을예측하기위해사용되어지는반면, 연간오염부하량예측에대해서만평가가이루어졌거나, 보정과정에대한평가나, 검정과정이이루어지지않았다. LOADEST 는 11개의회귀식을가지고있으며, 이중 2 개는특정기간에대한오염부하량을산정하기위한것이며, 그외 9개의회귀식이주어진유량과수질자료에대해모형의보정및오염부하량을예측하기위한것이다. 이 9개의회귀식은유량만을이용해오염부하량을산정하는회귀식부터유량과측정시간을이용하는회귀식까지다양하다. LOADEST 의회귀식은로그로치환된오염부하량을산정하기위한것이다. LOADEST 의회귀식들은다양한형태의유량과측정시간을고려하도록되어있으나, 유량에대해서는로그로치환하는데에비해, 측정시간에대해서는로그로치환되지않은값을사용하고있다. 비점오염원은강우시많은양이유출이되기때문에유량과높은상관관계를가질확률이크지만, 비점오염원은계절과같은시간에따라변동할수있기때문에, 오염부하량을산정하는데에있어유량과측정시간은모두중요하다 (Robertson, 2003). 따라서본연구에서는유량과측정시점을대등하게고려하여오염부하량을예측하는회귀식과 LOADEST에의한예측치과실측치를비교하여, 회귀식을이용한일부하량산정방법을분석하는데에있다. 재료및방법 수질자료의이용본연구에서개발된회귀식의검정을위해, United States Geological Survey (USGS, http://water.usgs.gov/owq/ data.html) 의수질자료가사용되었다. 유역의비점오염원발생은유역내특성뿐만아니라, 유역내인위적인요소또한영향을줄것으로판단된다. 오염부하산정을위한회귀식은유역의강우나지형, 인위적인요소등과같은특성은고려할수없다. 따라서이러한영향을최소화하기위하여, USGS의수질자료중, 장기간에걸쳐측정되고, 비교적유역면적이 작은지점에대해측정된수질자료가사용되었다. 총 4개지점 (Table 1) 에서측정된수질자료가사용되었으며, 각지점은 44 km 2 에서 360 km 2 의유역면적을가졌으며, 약 10년에서 20년에걸쳐각수질자료에대해 135개에서 1,437개의수질자료가측정되었다. 각지점에대해서수질자료의유무에따라 4-5개의질소와인에관련된수질자료가사용되었다 (Table 2). 수문모형이나회귀식등에대해적용성을판단할때에는보정뿐만아니라검정결과도함께분석이되어야하기때문에본연구의회귀식역시보정및검정과정을거쳤다. 보정과검정과정을위해서는실측치를분할해야하며, 일반적으로는자료의기간에의해분할하여보정과검정과정을거치나, 회귀식의경우보정시사용된자료의범위를벗어나예측하게될경우, 도시화등과같은유역의장기간에걸친변화등에의해회귀식에의한예측치에대한불확실성이커질것으로예상되었다. 따라서본연구에서는실측자료를분할하는데에있어, 보정자료와검정자료의기간이같도록할필요가있었으며, 이에실측자료의측정된날짜와무관하게, 각자료의홀수번째자료를보정자료로, 각자료의짝수번째자료를검정자료로사용하였다. 따라서각실측수질자료는회귀식에대한보정과정과검정과정에서거의같은기간과같은개수의수질자료가사용이되었다. Table 1. United States Geological Survey stations for water quality data USGS station number 03353637 05427948 03303280 04063700 Code Site name Little Buck Creek near Indianapolis, Indiana Pheasant Branch at Middleton, Wisconsin Ohio River at Cannelton Dam at Cannelton, Indiana Popple River near Fence, Wisconsin Drainage area (km 2 ) 44 47 251 360 Parameter name Period 1994.1.3. 2003.9.2. 1974.7.17. 2012.2.22. 2000.2.23. 2009.12.7 1980.10.21. 2010.6.22. Table 2. United States Geological Survey water quality data code and description 00600 Total nitrogen, water, unfiltered, milligrams per liter 00613 Nitrite, water, filtered, milligrams per liter as nitrogen 00631 00665 00671 Nitrate plus nitrite, water, filtered, milligrams per liter as nitrogen Phosphorus, water, unfiltered, milligrams per liter as phosphorus Orthophosphate, water, filtered, milligrams per liter as phosphorus

Estimation of Pollutant Load Using Genetic-algorithm and Regression Model 39 일부하량예측을위한회귀식의이용 LOADEST는 11개의회귀식을가지고있으며회귀식번호를지정할경우지정된회귀식에의해회귀식계수들을보정하고, 이렇게보정된계수를이용하여미계측지점에대한오염부하량을산정한다. 하지만회귀식번호를 0으로지정할경우, 회귀식번호 1-9번중주어진수질자료를통한회귀식의보정결과가 Akaike Information Criterion에의해, 예측치가실측치에가장가까운회귀식에의해미계측지점에대한오염부하량을예측한다. 식 (1) 에서식 (9) 에서보이는바와같이, 식 (1) 과식 (2) 의경우오염부하량을유량에의해서만산정하는데, 이는수질자료가유량자료와매우큰상관관계를보일경우사용될수있으며, 식 (3) 부터식 (9) 의경우는유량과함께측정시간 ( 계절적변화 ) 이함께수질자료가상관관계가있을때사용될수있다. 앞서언급한바와같이, LOADEST의회귀식들은유량과측정시간을모두고려할수있으나, 회귀식에의해로그로치환된오염부하량을예측하는것이다. 다시말해, 회귀식의계수보정에서회귀식에의해산정된값들은지수함수에의해다시오염부하량으로산정이된다 (USGS Report, 2004). 하지만, 로그로치환된오염부하량을산정하는데에있어, 유량은로그로치환하여고려하는반면, 측정시간에관한항은로그로치환되지않고보정과정을거치기때문에이과정에서유량과측정시간은대등한위치에있다고보기어렵다. 이러한유량과측정시간에대한고려가실측치에가까운예측치를위한회귀식계수보정을가능하게할수도있지만, 수질자료는수질자료의종류와측정지점에따라달라질수있기때문에, 유량과측정시간을대등하게고려하는회귀식역시필요할것으로판단되었다. 일부하량 (kg): ln (1) ln ln (2) ln (3) ln sin cos (4) ln ln (5) ln ln sin cos (6) ln sin cos (7) ln ln sin cos ln ln sin (9) cos a 0 - a 6 = 회귀식계수 Q = 유량 dtime = 연중시간을 0 1 의소수로환산한값 따라서본연구에서는, 오염부하량을산정하는회귀식의기본형식에로그로치환하지않고, 유량과시간을고려할수있도록하였다 ( 식. 10). 본연구에서제안되고사용된회귀식 (8) 의첫번째항은유량에관련된오염부하를고려하기위함이며, 두번째및세번째항은시간에따라변동하는오염부하를고려하기위함이다. 다시말해, 본연구의회귀식은유량과시간을동등하게고려할수있도록하였다. 일부하량 (kg/d): sin sin L = 일부하량 (kg/d) Q = 유량 dtime = 연중시간을 0 1의소수로환산한값 a 0 - a 7 = 회귀식계수 (10) LOADEST 는모형내회귀식을보정하기위해최우추정법 (Maximum Likelihood Estimation; MLE) 과개선된최우추정법 (Adjusted Maximum Likelihood Estimation; AMLE) 그리고오차절대값최소화추정법 (Least Absolute Deviation; LAD) 에의해회귀식을보정하며, 회귀식에의한예측치와실측치의차이가표준정규분포를따를때에는 AMLE나 MLE에의한오염부하량을사용하고그렇지않을시에는 LAD에의한오염부하량을사용하도록제안하고있다 (USGS Report, 2004). 이러한 AMLE, MLE, 그리고 LAD 는회귀식을보정하는데에있어최적화기법중하나이며, 본연구에서는식 (10) 의회귀식계수들을보정하기위해유전자알고리즘을사용하였다. 유전자알고리즘은크게선택, 교차, 변이의과정을가진다. 유전자알고리즘은복잡한문제를효과적으로해결하기위해서, 여러분야에걸쳐사용되어왔다 (Togan and Daloglu, 2008). 따라서본연구에서는유전자알고리즘을이용하여회귀식의계수들을보정하였다. 결과및고찰 총 19개의유량과수질자료가본연구의유전자알고리즘에의한회귀식과 LOADEST 보정및검정에이용되었었다. 회귀식과 LOADEST의보정및검정결과를판단하기위해 Nash-Stucliffe Efficiency (NSE; 식 11) 과결정계수 (Coefficient of Determination; R 2 ; 식 12) 가사용되었다. Santhi 등 (2001) 은 NSE와 R 2 가각각 0.5와 0.6일때를기준으로모형에의한예측치를판단한바있다. 따라서본연구의회귀식와회귀식의계수들을보정하기위한유전자알고리즘에의한예측지의정확도를판단하기위해서 NSE와 R 2 가함께고려되었다. NSE와 R 2 는실측치 (Oi), 실측치평균 ( O), 예측치 (P i), 예측치평균 ( P) 에의해계산된다. Nash-Stucliff Efficiency: (11)

40 PARK Coefficient of Determination: LOADEST 보정및검정결과 (12) Table 3에서보이는바와같이, LOADEST 의보정과정에서실측치와예측치의 NSE는 -1.20 (USGS 지점 05427948, 수질자료 00671) 에서 0.97 (USGS 지점 03303280, 수질자료 00631) 으로한개의수질자료를제외한예측치에서 0.5보다큰값을보였으며 (Fig. 1), R 2 는 0.53 (USGS 지점 05427948, 수질자료 00671) 에서 0.97 (USGS 지점 03303280, 수질자료 00631) 으로한개의수질자료를제외한예측치에서 0.6보다큰값을보였기때문에 (Fig. 2) LOADEST의보정이잘된것으로판단되었다. LOADEST의검정과정에서실측치와예측치의 NSE는 -1.25 (USGS 지점 05427948, 수질자료 00671) 에서 0.94 (USGS 지점 03353637, 수질자료 00665) 로 19개의수질자료에대해 13개의수질자료에대해서 0.5보다큰값을보였다 (Fig. 1). R 2 는 0.36 (USGS 지점 04063700, 수질자료 00631) 에서 0.98 (USGS 지점 03353637, 수질자료 00600) 으로 19개의수질자료에대해 15개의수질자료에대해서 0.6보다큰값을보였다 (Fig. 2). 19번의 LOADEST의보정및검정결과중에서 NSE가 0.5보다크고 R 2 가 0.6보다큰예측치는총 13개 (68%) 였으며, 따라서 LOADEST의보정과회귀식에의한오염부하량예측은비교적잘이루어진것으로판단되었다. USGS의 4개지점들은각기다른유역면적과각기다른실측치의개수를가지고있다. 같은종류의수질자료 (00665) 에대해 USGS 지점 04063700과 USGS 지점 03303280에대한보정및검정결과를비교해볼때, 역시많은양의실측치를통한검보정이반드시실측치에유사한예측치를얻을수있다고판단하기는힘든것으로보인다. 또한, USGS 지점 05427948의수질자료 00665의경우 719개의수질자료 ( 보정시 ) 와 718개의수질자료 ( 검정시 ) 를이용하여보정과정에서는 NSE와 R 2 가모두 0.7보다크고, 검정과정에서는 NSE와 R 2 가모두 0.6보타컸기때문에보정및검정과정에서예측치가실측치에매우근사하였다. 하지만더적은양의수질자료가이용된 USGS 지점 03303280의수질자료 00665의경우 67개의수질자료를통한보정및검정과정에서모두 NSE와 R 2 가모두 0.7보다컸기때문에이역시많은양의수질자료가반드시실측치와가까운예측치를의미한다고보기는힘든것으로판단된다. Robertson (2003) 는수질자료측정빈도에따른 23 종류의수질자료와회귀식을이용해오염부하량평가를한바있으며, 많은양의수질자료가반드시실측치에더가까운예측치를의미하지않는다고제안한바와일치한다. Table 3. Nash-Stucliffe Efficiency and coefficient of determination of LOADEST in calibration and validation Station number Calibration Validation (Parameter code) NSE R 2 NUM * NSE R 2 NUM * 03303280 (00600) 0.92 0.92 67 0.88 0.91 67 03303280 (00613) 0.54 0.55 67 0.45 N 0.48 R 66 03303280 (00631) 0.97 0.97 67 0.81 0.85 66 03303280 (00665) 0.72 0.75 67 0.76 0.86 67 03303280 (00671) 0.69 0.73 67 0.50 0.65 67 03353637 (00600) 0.89 0.95 67 0.97 0.98 66 03353637 (00613) 0.71 0.75 67 0.37 N 0.83 66 03353637 (00631) 0.73 0.78 67 0.61 0.92 66 03353637 (00665) 0.51 0.91 67 0.94 0.96 66 03353637 (00671) 0.97 0.97 67 0.60 0.87 66 04063700 (00600) 0.91 0.92 78 0.41 N 0.48 R 77 04063700 (00613) 0.94 0.94 69 0.85 0.89 69 04063700 (00631) 0.51 0.59 95 0.20 N 0.36 R 94 04063700 (00665) 0.71 0.72 139 0.45 N 0.48 R 138 04063700 (00671) 0.60 0.61 81 0.78 0.82 81 05427948 (00600) 0.74 0.74 101 0.83 0.83 100 05427948 (00631) 0.56 0.62 79 0.83 0.83 79 05427948 (00665) 0.71 0.83 719 0.64 0.68 718 05427948 (00671) -1.20 N 0.53 R 138-1.25 N 0.64 138 NSE: Nash-Stucliffe efficiency * NUM: Number of water quality samples R 2 : Coefficient of determination N: NSE less than 0.5 R: R 2 less than 0.6 Fig. 1. Nash-Stucliff Efficiency of LOADEST in calibration and validation.

Estimation of Pollutant Load Using Genetic-algorithm and Regression Model 41 과정에서모두 NSE와 R 2 가모두 0.9보다컸기때문에이역시많은양의수질자료가반드시실측치와가까운예측치를의미한다고보기는힘든것으로판단된다. Table 4. Nash-Stucliffe Efficiency and coefficient of determination of the regression model using geneticalgorithm in calibration and validation Fig. 2. Coefficient of determination of LOADEST in calibration and validation. 유전자알고리즘에의한회귀식보정및검정결과 Table 4에서보이는바와같이, 회귀식의보정과정에서실측치와예측치의 NSE는 0.53 (USGS 지점 03303280, 수질자료 00613) 에서 0.96 (USGS 지점 03353637, 수질자료 00600) 으로모두 0.5보다큰값을보였으며 (Fig. 3), R 2 는 0.59 (USGS 지점 03303280, 수질자료 00613) 에서 0.96 (USGS 지점 03353637, 수질자료 00600) 으로대부분 0.6보다큰값을보였기때문에 (Fig. 4) 유전자알고리즘에의한회귀식은보정이잘된것으로판단되었다. 회귀식의검정과정에서실측치와예측치의 NSE는 -0.99 (USGS 지점 05427948, 수질자료 00631) 에서 0.90 (USGS 지점 03353637, 수질자료 00600) 으로 19개의수질자료에대해 LOADEST와비슷한 12개의수질자료에대해서 0.5보다큰값을보였다 (Fig. 3). R 2 는 0.37 (USGS 지점 04063700, 수질자료 00665) 에서 0.97 (USGS 지점 03353637, 수질자료 00600) 으로 19개의수질자료에대해 LOADEST와비슷한 14개의수질자료에대해서 0.6보다큰값을보였다 (Fig. 4). 19번의유전자알고리즘에의한회귀식의보정및검정결과중에서 NSE가 0.5 보다크고 R 2 가 0.6보다큰예측치는총 10개 (53%) 로, LOADEST 보다 3개적은수질자료에대해예측치의보정및검정과정에서실측치에가까운일별오염부하량을보였다. 회귀식을이용한일별오염부하량예측역시, LOADEST 와비슷한결과및결론을도출할수있었다. 같은종류의수질자료 (00671) 에대해 USGS 지점 05427948과 USGS 지점 03303280에대한보정및검정결과를비교해볼때, 많은양의실측치를통한검보정이반드시실측치에유사한예측치를얻을수있다고판단하기는힘든것으로보인다. 특히, USGS 지점 05427948의수질자료 00665의경우 719개의수질자료 ( 보정시 ) 와 718개의수질자료 ( 검정시 ) 를이용하여보정과정에서는 NSE와 R 2 가모두 0.8보다크고, 검정과정에서는 NSE와 R 2 가모두 0.7에가까웠기때문에보정및검정과정에서예측치가실측치에매우근사하였다. 하지만 USGS 지점 03353637의수질자료 00600의경우 67개의수질자료 ( 보정시 ) 와 66개의수질자료 ( 검정시 ) 를이용하여보정및검정 Station number Calibration Validation (Parameter code) NSE R 2 NUM * NSE R 2 NUM * 03303280 (00600) 0.90 0.91 67 0.86 0.90 67 03303280 (00613) 0.53 0.59 R 67 0.26 N 0.43 R 66 03303280 (00631) 0.95 0.95 67 0.76 0.82 66 03303280 (00665) 0.65 0.74 67 0.65 0.84 67 03303280 (00671) 0.82 0.82 67 0.56 0.66 67 03353637 (00600) 0.96 0.96 67 0.90 0.97 66 03353637 (00613) 0.88 0.89 67 0.79 0.80 66 03353637 (00631) 0.78 0.79 67 0.29 N 0.88 66 03353637 (00665) 0.94 0.95 67 0.68 0.92 66 03353637 (00671) 0.94 0.95 67 0.49 N 0.88 66 04063700 (00600) 0.92 0.93 78 0.51 0.52 R 77 04063700 (00613) 0.91 0.91 69 0.69 0.80 69 04063700 (00631) 0.67 0.73 95-0.72 N 0.46 R 94 04063700 (00665) 0.76 0.78 139 0.22 N 0.37 R 138 04063700 (00671) 0.67 0.69 81 0.33 N 0.78 81 05427948 (00600) 0.63 0.66 101 0.57 0.77 100 05427948 (00631) 0.76 0.78 79-0.99 N 0.74 79 05427948 (00665) 0.84 0.86 719 0.67 0.68 718 05427948 (00671) 0.79 0.80 138 0.53 0.55 R 138 NSE: Nash-Stucliffe efficiency * NUM: Number of water quality samples R 2 : Coefficient of determination N: NSE less than 0.5 R: R 2 less than 0.6 Fig. 3. Nash-Stucliff Efficiency of the regression model using genetic-algorithm in calibration and validation.

42 PARK 수문모형에비해적은노력과시간을요구한다. 본연구에사용되었던 LOADEST와유전자알고리즘을이용한회귀식역시유량과수질자료만을이용하여보정과검정과정이이루어졌으며, 적지않은예측치가실측치와가까운것으로나타났다. 그러므로회귀식의사용은다른수문모형의사용보다효율적인것으로보인다. 하지만이와동시에, 수문모형은모형자체의여러변수를통해실측치에보다가까운예측치를이끌어낼수있는기회가주어지는반면, 회귀식은이에대한방법이제한적이다. 이와같은점을고려할때, 회귀식에의한예측치의사용에있어충분한검정이주어져야하며, 이러한보정및검정과정이충분히이루어진다면오염부하량을산정하는데에있어보다효율적으로이용될수있을것으로판단된다. Fig. 4. Coefficient of Determination of the regression model using genetic-algorithm in calibration and validation. 결론 본연구에서사용된수질자료는장기간에걸쳐총 4개지점에서측정된 5종류였으며, LOADEST와유전자알고리즘을이용한회귀식의보정및검정을위해, 실측자료는모두두개의자료로분할되어사용되었다. 일반적으로많은양의수질자료를통해회귀식을보정해야실측치에가까운예측치를구할수있다고여겨지는반면, 본연구에서사용된수질자료에대해 LOADEST와유전자알고리즘을이용한회귀식모두많은양의수질자료가반드시실측치와가까운예측치를보이지는않았다. 또한, LOADEST와유전자알고리즘을이용한회귀식모두, 보정과정에서실측치와작은차이를보였다고해서반드시검정과정에서실측치와작은차이를보이지않았다. 이는유량자료에비해측정빈도가낮은수질자료를회귀식에의해일부하량이나연부하량을산정할때, 회귀식의보정과정에서사용된실측치와예측치가작은오차를보인다고할지라도미계측지점에대해서는오차가클수도있으며따라서일부하량이나연부하량역시실제발생된오염부하량과는적지않은오차를보일수있다는것을가리킨다. 따라서다른수문모형과마찬가지로, 미계측지점에대해오염부하량산정을위한회귀식사용은보정과정뿐만아니라검정과정을통해평가가된후사용되어야할것으로판단된다. 또한, LOADSET 와유전자알고리즘을이용하는회귀식에의한보정및검정결과를볼때, 두회귀식에대해모두실측치와큰오차를보이는수질자료가있는반면, 선택적으로실측치와예측치가높은상관관계를보인수질자료가있었다. 그러므로측정된수질자료를이용하여미계측지점에대해보간할때, 어느하나의모형을일괄적으로사용하기보다는, 실측치를분할하여보정과검정과정을통해보다실측치에가까운예측치를보인회귀식을사용하는것이미계측지점에대한수질자료예측이효과적일것으로보인다. 회귀식은일반적으로유량과수질자료만을요구하기때문에, References Carey, R.O., Migliaccio, K.W., Brown, M.T., 2011. Nutrient discharges to Biscayne Bay, Florida: trends, loads, and a pollutant index, Sci. Total Environ. 409, 530-539. Coynel, A., Schafer, J., Hurtrez, J., Dumas, J., Etcheber, H., Blanc, G., 2004. Sampling frequency and accuracy of SPM flux estimates in two contrasted drainage basins, Sci. Total Environ. 330, 233-247. Das, S.K., Ng, A.W.M., Perera, B.J.C., Assessment of nutrient and sediment loads in the Yarra river catchment, 19th International Congress on Modelling and Simulation, Perth, Australia, 12-16 December 2011, http://mssanz.org.au/modsim, pp. 3490-3496. Dornblaser, M.M., Striegl, R.G., 2009. Suspended sediment and carbonate transport in the Yukon river basin, Alska: Flouxes and potential future responses to climate change, Water Resour. Res. 45, W06411, doi:10.1029/ 2008WR007546 Henjum, M.B., Hozalski, R.M., Wennen, C.R., Novak, P.J., Arnold, W.A., 2010. A comparison of total maximum daily load (TMDL) calculations in urban streams using near real-time and periodic sampling data, J. Environ. Monit. 12, 234-241. Horowitz, A.J., 2003. An evaluation of sediment rating curves for estimating suspended sediment concentrations for subsequent flux calculations, Hydrolog. Proc. 17, 3387-3409. Johnes, P.J., 2007. Uncertainties in annual riverine phosphorus load estimation: Impact of load estimation methodology, sampling frequency, baseflow index and catchment population density, J. Hydrol. 332, 241-258. King, K.W., Harmel, R.D., 2003. Considerations in selecting a water quality sampling strategy, Trans. ASAE. 46, 63-73.

Estimation of Pollutant Load Using Genetic-algorithm and Regression Model 43 Kronvang, B., Bruhn, A.J., 1996. Choice of sampling strategy and estimation method for calculating nitrogen and phosphorus transport in small lowland streams, Hydrolog. Proc. 10, 1483-1501. Oh, J., Sankarasubramanian, A., 2011. Interannual hydroclimatic variability and its influence on winter nutrients variability over the southeast United States, Hydrol. Earth Sys. Sci. Discuss. 8, 10935-10971. Park, Y., Kim, J., Park, J., Hong, J.H., Choi, D.H., Kim, T., Choi, J., Ahn, J., Kim, K.S., Lim, K.J., 2007. Evaluation of SWAT applicability to simulation of sediment behaviors at the Imha-Dam watershed, J. Korean Soc. Water Qual. 23, 467-473. Robertson, D.M., Roerish, E.D., 1999. Influence of various water quality sampling strategies on load estimates for small streams, Water Resour. Res. 35, 3747-3759. Robertson, D.M., 2003. Influence of different temporal sampling strategies on estimating total phosphorus and suspended sediment concentration and transport in small streams, J. Amer. Water Resour. Assoc. 39, 1281-1308. Santhi, C., Arnold, J.G., Williams, J.R., Dugas, W.A., Srinivasan, R., Hauck, L.M., 2001. Validation of the SWAT model on a large river basin with point and nonpoint sources, J. Amer. Water Resour. Assoc. 37, 1169-1188. Toğan, V., Daloğlu, A.T., 2008. An improved genetic algorithm with initial population strategy and self-adaptive member grouping, Comput. & Struct. 86, 1204-1218.