2017 년공공빅데이터분석사업
I. 모델의개요 위험운전발생가능성이높은고속도로구간을예측 9 월초에경부고속도로에서고속버스가승용차를들이받아 40 대부부가숨진안타까운사고가있었습니다. 7 월에는광역버스기사가졸음운전을하다가차선을넘어앞서가던차량을추돌해서 50 대부부가숨지기도하였습니다. 고속도로에서의버스사고가대형사고로이어져소중한생명과재산을잃는사고가빈번하게발생하고있습니다. 고속도로에서의교통사고로소중한인명과재산피해증가 2
Ⅱ. 분석데이터 디지털운행기록 3 천 9 백만건, VDS 지점정보 1 백 40 만건및추가데이터확보 No 1 데이터명 ( 제공기관 ) 디지털운행기록계 ( 교통안전공단 ) 데이터설명 ( 항목 ) 데이터범위데이터건수데이터크기 경부고속도로를경유하는광역버스등의운행기록데이터 2017 년 1 월 39,111,575 4.7 Gb 2 VDS 설치정보 ( 한국도로공사 ) VDS_ID, VDS 존유형구분명, 노선구성순번, 기점종점방향구분코드등 전국 7,466 1 Mb 3 VDS 지점교통량 ( 한국도로공사 ) 집계일자, 집계시분, VDS_ID, 차로유형구분코드, 교통량 2017 년 1 월 1,360,248 72 Mb 4 VDS 지점통행속도 ( 한국도로공사 ) 집계일자, 집계시분, VDS_ID, 차로유형구분코드, 평균속도 2017 년 1 월 1,360,248 95 Mb 5 교통사고 ( 경찰청 ) 교통사고의발생시각, 발생지점, 사망자수, 부상자수, 사고차량종류, 법규위반내용등 2012 ~ 2016 년 4,744,645 2 Gb 6 도로중심선 ( 한국도로공사 ) 노선번호, 도로명, 이정, X 좌표값, Y 좌표값, GRS80X 좌표값, GRS80Y 좌표값등 경부고속도로 41,808 3 Mb 7 AWS 날씨데이터 ( 기상청 ) 지점, 일시, 기온 ( C), 풍향 (deg), 풍속 (m/s), 강수량 (mm) 경부고속도로 15,261 82 Kb 8 콘존 ( 한국도로공사 ) IC 와 IC, IC 와 JC 사이의구간, 본선영업소와 IC 나 JC 사이의구간에대한기준데이터 전국 1,371 84 Kb 3
Ⅲ. 분석내용및절차 고속도로위험운전행동별위험구간예측 분석목적 교통안전공단에서제공하는 11대위험운전행동기준으로위험운전행동이많이발생하는경부고속도로구간예측 위험운전행동이많이발생되는구간은교통사고발생가능성이높음 분석방향 교통사고와위험운전행동간상관관계도출 교통사고와상관성이높은위험운전행동을활용하여사고위험구간예측교통사고는위험운전행동중급감속, 급가속, 급진로변경과상관성이높음 구분 버스기준 과속위험구간 급가속위험구간 급감속위험구간 급차로변경위험구간 과속장기과속급가속급출발급감속급정지급진로변경급앞지르기 도로제한속도보다 20km/h 초과운행시 도로제한속도보다 20km/h 초과해서 3 분운행시 6.0km/h 이상속도에서초당 6km/h 이상가속운행하는경우 5.0km/h 이하속도에서초당 8km/h 이상가속운행하는경우 초당 9km/h 이상감속하여속도가 6.0km/h 이상인경우 초당 9km/h 이상감속하여속도가 5.0km/h 이하인경우 속도가 30km/h 이상에서진행방향이좌 / 우측 8 sec 이상으로차로변경하고, 5 초동안누적각도 ±2 /sec 이하, 가감속이초당 ±2km/h 이하인경우 속도가 30km/h 이상에서진행방향이좌 / 우측 8 sec 이상으로차로변경하고, 5 초동안누적각도 ±2 /sec 이하, 가감속이초당 3km/h 이상인경우 4
Ⅲ. 분석내용및절차 고속도로위험운전행동별위험구간예측 머신러닝 (SVM) 을활용하여위험운전행동예측 실제위험운전행동을활용하여위험운전행동을예측 예측된위험운전행동중실제위험운전행동은아니지만, 학습을통해위험운전에가깝게운전한경우를추출 해당데이터들은실제위험운전행동의 DTG 데이터로판단되지않지만, 기계학습을통해도출된위험운전에준하는행동임실제위험운전행동과예측위험운전행동을모두고려하여보다정교한운전위험구간도출가능 단계알고리즘비고 1 DTG 데이터를활용, 실제발생한위험운전행동도출 2 도출된위험운전행동 DTG 데이터개수와동일하게정상 DTG 데이터랜덤샘플링 3 1, 2 단계에서생성된데이터를병합하여학습용데이터셋생성 4 5 6 학습용데이터셋및 SVM 알고리즘을활용하여위험운전행동분류모델도출 실제발생한위험운전행동은아니나, SVM 모델을통해위험운전행동에가깝다고판단된데이터추출 ( 잠재적위험운전행동 ) 잠재적위험운전행동판단임계치는시범시행과정을거쳐조정 예 ) 데이터분류시의일반적인임계치 :0.5( 확률 :50%) 를 0.8, 0.9 등으 로상향조절 7 각구역별실제위험운전행동및잠재적위험운전행동빈도도출 전체 DTG 데이터 실제위험운전행동 실제위험운전행동 YES NO 예측위험운전행동 YES 실제위험운전행동 잠재적위험운전행동 잠재적위험운전행동 임계치 NO 실제위험운전행동 비위험운전행동 5
Ⅲ. 분석내용및절차 고속도로위험운전행동별위험구간예측 Support Vector Machine(SVM) 모델활용 현재위험운전행동기준으로는실제위험운전으로판단되지않지만, 기계학습을통해위험운전에준하는행동예측 예측정확도상승및이전상황을고려하기위해각 DTG 데이터마다이전 3초 /5초간속도 RPM 브레이크데이터병합 다양한방식의회귀분석및 SVM을시도하여최적의예측모델도출 활용데이터 전처리 빅데이터분석 모델검증 상관관계분석 분석 회귀식및모델도출 모델별학습 통합데이터 버스 DTG VDS 총교통량 VDS 평균속도 날씨 (ASOS) 도로의고도 위험운전행동여부 = Y 데이터 위험운전 + 이전 3 초 위험운전 + 이전 5 초 독립변수 : 통합데이터변수들종속변수 : 위험운전행동여부 (Y/N) 연속형변수 : 독립표본 t 검정 명목형변수 : 카이제곱검정 불필요한변수제거 연속형변수표준화및더미변수생성 Support Vector Machine Kernel Trick Radial Basis Sigmoid Linear Polynomial RB Model Sigmoid Model Linear Model Polynomial Model 통합데이터전체 적중률계산 Best Model 선정 분석용데이터생성 회귀분석 위험운전데이터 + 통합데이터 위험운전행동여부비율 1:1 70% 학습용 30% 검증용 Ridge Logistic Regression Ridge Model 6
Ⅲ. 분석내용및절차 고속도로위험운전행동별위험구간예측 예측결과 실제위험운전행동을활용해해당위험운전행동이많이발생하는위험구간도출 예측위험운전행동을활용해실제위험운전행동만으로는위험성이높지않았지만예측위험운전행동까지고려하면위험성이높아지는구간도출 실제위험운전행동및예측위험운전행동을모두활용하여위험구간정교화 급진로변경예측결과 실제급진로변경발생비율은낮으나, 잠재급진로변경발생비율은높은지점 -> 실제급진로변경만으로는위험성이도출되지않는지점 실제급진로변경발생비율은높고, 잠재급진로변경발생비율도높은지점 -> 위험성이가중되는지점 오산서울 오산서울 7
Ⅲ. 분석내용및절차 고속도로이상운전위험구간예측 분석목적 시계열형식인 DTG 데이터의특징을활용 LSTM 머신러닝을통해평소운전패턴을학습시킨후, 평소와는다른이상운전패턴탐색 LSTM(Long Short-Term Memory) : 시계열데이터와같은시간의흐름에따라변화하는데이터를예측하기위한딥러닝모델 분석방향 기존운전패턴과머신러닝을통해도출된예측운전패턴을비교 두패턴간차이값을계산하여, 차이값이클수록평소운행패턴을벗어난것이라고판단 운전중졸음이발생하면평상시와다른이상운전패턴을보일것이다. 평상시와다른운전패턴은속도, RPM, 브레이크조작에서나타난다. 평상시와다른운전패턴을보이는구간이많은곳은졸음운전이의심된다. 도로환경 ( 통행속도등 ) DTG ( 운행기록 ) ( 탐색적분석 ) 통계분석 correlation 분석 산포도시각화 데이터전처리검증 변수선택시참고 ( 머신러닝 #1) input 변수, output 변수 딥러닝모델적용 시계열예측모델 (LSTM) 적용 ( 머신러닝 #2) input변수, ( output 머신러닝변수) 변경 딥러닝 input 모델변수적용, output변수결정 시계열예측 딥러닝모델적용 (LSTM) 적용 시계열예측모델 (LSTM) 적용 머신러닝모델성능비교 이상운전위험구간예측 8
Ⅲ. 분석내용및절차 고속도로이상운전위험구간예측 LSTM 딥러닝을통한운전행태학습결과 딥러닝을통한속도예측은오차율이상대적으로작으며, RPM 예측은상대적으로높음 속도는변화가부드러우나, RPM은외부환경, 운전습관, 브레이크조작등에의한변화가큰경향을보임 이상운전패턴이다발생하는구간이존재함 실제운행데이터와예측운행데이터간속도차이비교 딥러닝을통해학습한운전자의평소패턴으로생각되는운전속도와실제 DTG 데이터에기록된속도차이가큼 -> 운전자가이상운전을했을가능성이큼 9
Ⅲ. 분석내용및절차 운전위험구간예측알고리즘 통계분석결과와선행연구자료를참조하여요소모델별가중치를부여하였으며, 모델들을병합하여최종운전위험구간예측산출식을도출 머신러닝 고속도로과속위험구간예측 3) 머신러닝 고속도로급가속위험구간 1) 예측 0.261 Y ( 위험지수 ) = 격자내급가속위험지수 0.261 + 격자내급감속위험지수 0.383 + 격자내급차로변경위험지수 0.356 머신러닝 머신러닝 딥러닝 고속도로급감속위험구간 1) 예측 0.383 고속도로급차로변경위험구간예측 고속도로의심행동도출 1) 0.356 모델병합 고속도로운전위험구간예측 1.0 고속도로이상운전위험구간예측 4) 2) 주 1) 사업용차량통합단말표준플랫폼및안전운전지원기술개발최종보고서 ( 교통안전공단. 2017.06) 에서위험운전행동가중치를각각급가속 0.18, 급감속 0.264, 급진로변경 0.245 로산출한것을 3 개의합이 1 이되도록가중치조절함주 2) 1.0 = 0.261 + 0.383 + 0.356 주 3) 과속은교통사고와의상관관계가낮으므로예측알고리즘에서제외주 4) 이상운전과사고와의관련성은향후많은연구가필요한부분이므로이상운전을운전위험구간예측알고리즘에서제외 10
Ⅳ. 분석결과 운전위험구간예측결과 운전위험구간시각화 다음맵 API를활용하여 100m X 100m 구간별위험지수시각화 도로방향및 VDS 속도구분별세부시각화 격자선택시, 해당격자의통계정보확인가능 11
Ⅳ. 분석결과 운전위험구간예측결과 운전위험구간예측결과 순위위험지수상세내역지도 위험지수상세내역지도 1 0.610 부산기점 403.1km 위험지수 : 0.610 5 년간사고건수 : 24 ( 사망 :4, 중상 :124, 경상 :22, 부상 :116) 과속위험지수 : 0.003 급가속위험지수 : 0.092 급감속위험지수 : 0.372 급진로변경위험지수 : 0.147 이상행동위험지수 : 0.673 0.518 부산기점 421.6km 위험지수 : 0.518 5 년간사고건수 : 0 ( 사망 :0, 중상 :0, 경상 :0, 부상 :0) 과속위험지수 : 0.000 급가속위험지수 : 0.261 급감속위험지수 : 0.040 급진로변경위험지수 : 0.217 이상행동위험지수 : 0.823 2 0.498 부산기점 420.1km 위험지수 : 0.498 5 년간사고건수 : 0 ( 사망 :0, 중상 :0, 경상 :0, 부상 :0) 과속위험지수 : 0.043 급가속위험지수 : 0.206 급감속위험지수 : 0.251 급진로변경위험지수 : 0.041 이상행동위험지수 : 0.798 0.463 부산기점 391.9km 위험지수 : 0.463 5 년간사고건수 : 0 ( 사망 :0, 중상 :0, 경상 :0, 부상 :0) 과속위험지수 : 0.027 급가속위험지수 : 0.015 급감속위험지수 : 0.282 급진로변경위험지수 : 0.167 이상행동위험지수 : 0.050 3 0.452 부산기점 403km 위험지수 : 0.452 5 년간사고건수 : 3 ( 사망 :1, 중상 :13, 경상 :4, 부상 :9) 과속위험지수 : 0.005 급가속위험지수 : 0.091 급감속위험지수 : 0.261 급진로변경위험지수 : 0.101 이상행동위험지수 : 0.494 0.414 부산기점 403.2km 위험지수 : 0.414 5 년간사고건수 : 7 ( 사망 :1, 중상 :30, 경상 :7, 부상 :22) 과속위험지수 : 0.000 급가속위험지수 : 0.019 급감속위험지수 : 0.116 급진로변경위험지수 : 0.279 이상행동위험지수 : 0.363 12
Ⅳ. 분석결과 운전위험구간예측결과검증 운전위험구간예측결과 5 년간경부고속도로에서발생한교통사고와운전위험구간비교검증 예측운전위험구간과실제교통사고간비교는데이터건수, 기간, 대상차량등많은측면에서한계점이존재함 상 / 하행선에서 5 년간교통사고가가장많이발생한서울요금소부근의교통사고와위험지수를비교해보면위험구간을충분히예측하고있음을알수있음 수원 IC 직후 서울요금소 버스전용차로끝 수원 IC 직후 잠원 IC 13
Ⅳ. 분석결과 통계적위험구간과운수회사별위험구간비교분석 운전위험구간예측결과 비교분석을통해통계적으로위험한구간뿐만아니라운수회사의노선별차별화된위험구간까지도출하여, 보다효과적인운수종사자교육및교통안전관리가가능함 전체버스 운수회사 A 활용데이터 모든회사, 모든노선의차량 289대 DTG 데이터 운수회사코드가 XX939 인차량 15대 데이터건수 39,111,575건 2,180,106건 기간 2017년 1월 운행구간 오산IC ~ 한남IC 사이 오산IC 출발 - 한남IC 도착 OR 한남IC 출발 - 오산IC 도착 전체버스 운수회사 A 14
Ⅴ. 향후활용계획 향후시스템적용및활용방안 실시간 전국적인교통사고예방이가능하며, 추가적인교육및정책수립시에도효과적인활용 운전위험구간예측대상도로확대 이상운전행동예측모델확대적용 분석모델고도화 / 확산 도로종류별로위험운전구간을예측할수있는표준화된모델개발 위험구간예측을통한전국적단위의교통사고예방 지자체단위의분석모델을개발하여표준모델보급 DTG 를실시간으로수집하여기개발된학습알고리즘으로분석후실시간으로이상운전행동을감지할수있는모델개발 실시간운전피드백을통한효과적인안전운행가능 교통안전관리 운수회사별특화된위험구간서비스 활용방안 기관내부에서교통안전관리및교통안전연구에활용할수있음 고속도로위험구간정보서비스 교통안전시설물의효율적설치 운수회사별다르게나타나는위험운전구간을추가로교육함으로써, 보다효과적인운수종사자교육이가능함 노선별, 운전자별, 요일별등다양한케이스별안전도모 15