정보시스템연구트렌드변화분석 : 토픽모델링과네트워크분석 안정국 a, 이규현 b, 김희웅 c a,b,c 연세대학교정보대학원서울특별시서대문구신촌동 134 Tel: +82-2-2123-4195, E-mail: a jace@yonsei.ac.kr, b statkyu@yonsei.ac.kr, c kimhw@yonsei.ac.kr Abstract 최근사물인터넷시대가도래함에따라 ICT 융복합환경에따른다양한기술의발전이이루어지고있으며, 관련된학문적이론및활용기술에대한관심이고조되고있다. 이러한패러다임의변화는학문들간의급격한융복합현상을초래하였으며, 특히, 정보시스템학 (Information Systems) 은이러한변화를선도해왔다. 그러나정보시스템이다른학문들과의관계에있어서융합적 (Convergence) 역할을해왔는지, 아니면분화적 (Divergence) 혹은파생적인역할을해왔는지에대한연구는부족한실정이다. 따라서, 본연구에서는시간경과에따른정보시스템의연구동향을비교분석하여핵심개념들을살펴봄으로써향후정보시스템학연구의방향에대한시사점을찾고자한다. 1980 년부터 2015 년까지의경영정보학의상위국제저널 48,102 개의논문제목, 저자, 초록, 키워드분석을통해저자들의공동연구네트워크분석및연구토픽추출결과를년대별로비교분석하여시각화하였다. 본연구의결과가정보시스템분야의연구자들에게정보시스템의정체성에대한폭넓은이해와향후연구방향에대한새로운시사점을주길기대한다. Keywords: 정보시스템 ; 연구동향 ; 공동연구네트워크 Ⅰ. 서론 최근인터넷과 ICT(Information & Communication Technology) 의발달로다양한정보와기술의융복합적활용이확산되고있다. 이에따라, 학술적연구에있어서도다양한학문들의실제적활용및적용이가능한정보시스템 (Information System, IS) 에대한관심도높아지고있다. 본연구는 1980 년부터 2015 년까지의정보시스템분야논문 48,102 개를과학인용온라인데이터베이스인 Web of Science 에서추출하여분석하고자한다. 기존의연구 (Chan. et al., 2006; 2014) 에서분류한 Pure IS( 순수정보시스템 ) 와 Hybrid IS( 융합정보시스템 ) 저널들을분석하였으며, 논문들의제목, 키워드, 그리고초록을중심으로주요어휘에대해빈도분석 (Frequency Analysis) 및네트워크분석 (Network Analysis) 을수행함으로써, 순수정보시스템과융합정보시스템연구주제의핵심적개념이무엇인지살펴보았다. 이를기반으로정보시스템연구동향을심화적으로파악하고분석하여향후정보시스템학연구동향에도움을주고자한다. 더나아가, 시간적경과추이에따른순수정보시스템와융합정보시스템의핵심적개념을분석하여정보시스템학문이다른학문들과의관계에서융합적인 (Convergence) 역할, 혹은분화적인 (Divergence) 역할을해왔는지에대해탐구하고자한다. 본연구의구성은다음과같다. 2 장에서는연구의결과도출을위해활용된토픽모델링방법론과, 융합과학 (Convergence Science) 및분화과학 (Divergence Science) 의개념적배경에대해살펴보며, 3 장에서는본연구의설계방법론에대해논의한다. 그리고 4 장의연구분석결과에이어, 마지막 5 장에서는본연구의결론과시사점을제시하고자한다. Ⅱ. 개념적배경 2.1. 토픽모델링 (Topic Modeling) 토픽모델링은각문헌을주제 (Topic) 의확률적혼합체로표현하고, 텍스트정보에서숨겨져있는주제들을찾기위해고안된통계적추론기법이다 (Blei et al., 2010). 가장대표적으로활용되고있는분석기법은 LDA (Latent Dirichlet Allocation) 알고리즘으로서, 높은성능과편의성으로인해토픽모델링분야에서표준적방법론으로인식되고있다. 대략적분석방법은다음과같다. 각문서의주제는소수의단어혼합물로구성되어있으며, 각단어의출현은문서의주제에의해결정된다고가정하여토픽모델링이수행된다 (Blei et al., 2010). 즉, 특정주제들의집합이라고가정된한문헌을구성하는단어들을확 -561-
률적으로계산하여, 이결과값을토픽주제어들의집합으로추출하는알고리즘이다. 토픽모델링에서는단어가서로독립적이지않다는가정 (Dirichlet Distribution) 에기초하여단어생성조건에따라사후확률을추론하며, 이는 Blei (2012) 의확률적그래프모델로표현된다 < 그림 1 참조 >. 그림 1 LDA 확률그래프모델 (Blei, 2012) 따라서토픽모델링은위와같은 LDA 모형에따라, 각종문서를다양한주제들로연관추론할수있는장점이존재하므로 (Blei et al., 2003, 2012; Park and Song, 2013), 이를활용하여생물정보학, 문헌정보학등다양한분야의학문에서 저널 (Journal) 이라는전문적매체를이용해학문적경향을파악하고자하는다수의연구가진행되고있다 (Gerrish and Blei., 2010; Song et al., 2013; 박자현 and 송민, 2013). 하지만정보시스템학분야에서토픽모델링을활용함으로써학문적경향을파악하고자한연구는존재하지않았으므로, 본연구에서는이러한방법론을통해약 35 여년간연구되어온정보시스템분야의논문 48,102 개를근간으로정보시스템학문의과거연구방향과향후발전방향에대해논의하고자한다. 2.2. 융합과학 (Convergence Science) 융합과학은과학, 기술및인문사회과학등세분화된학문들의복합적결합, 통합및응용에의해만들어진새로운과학분야라고할수있다. 20 세기중엽부터 21 세기, 즉, 근대에서현대로넘어가는시기에이르러본격적으로학문과기술의수렴및융합의흐름이전개되었다. 각각다른성격과특성을내포하고있다고여겨졌던다양한학문들이서로물리적, 추상적으로공통적법칙들을가지고있다는사실이증명되었고, 이는다학제간다양하고활발한연계적연구를이끌었다. 융합과학의대표적사례는세계적학술연구기관인 MIT 미디어랩 을들수있다. 이 기관은공학에예술과인문학등다소이질적인학문을새롭게접목시키며 상상력을발전시킨다 라는슬로건을가지고다양한방향으로연구를해왔다. MIT 미디어랩은이러한다학제적연구를통해세계모든어린이를위한 100 달러미만의컴퓨터, 스스로생각하는인공지능 (Artificial Intelligence) 로봇, 옷처럼입을수있는컴퓨터등창의적이고생산적인기술을만들어인류에혁신을가져다주고있다. 이와같이과학의발달은새로운국면으로접어들고있다. 융합과학은인문학, 사회과학, 예술, 공학, 과학및문화등여러영역의학문들을창조와융합의원리로탐구하여인간의삶뿐만아니라인간성을향상하는것이융합과학이궁극적으로추구하고자하는목적이다. 또한, 자연이라는하나의대상을각학문의개별적특성은유지하되각각의학문적특성을고려하여통합적인탐구를함으로써유의미한종합적시사점을이끌어내는것이융합과학의목표라할수있다. 2.3. 분화과학 (Divergence Science) 과거본래의학문은나뉘어져있지않았고하나의뿌리를가지고있었다. 하지만, 근래 18 세기말부터산업혁명을거치며연구의깊이가더해지고, 인류가세상을변화시키기위해학문체계가분화 (divergence) 되어더욱세밀히연구되어왔다. 이러한의미에서분화과학이란, 공통적인학문이라는토대안에있지만, 크게자연과학과사회과학등으로나뉘어각각상이한연구대상을탐구하고, 예측 (Prediction) 과의사소통 (Communication) 측면, 법칙 (Law) 과관습 (Convention) 적측면, 연역적측면과귀납적측면에서연구를한다는점에서아래의 < 표 1> 과같이차이를가지고구분되어연구되어왔다. Ⅲ. 연구설계 표 1 - 사회과학과자연과학 사회과학 자연과학 연구대상 인간혹은그들의의도적행위 객관의세계 설명력 의사소통기반 예측기반 일반화정도 관습의속성 법칙의속성 추론법 귀납법 연역법 본장에서는연구에관련된데이터수집과정과분석프로세스 ( 토픽모델링, 네트워크분석 ) 에대해설명하고자한다. 개략적인데이터분석프로세스는 < 그림 2> 와같이도식화된형태로나타나있다. 이러한과정을토대로연구를진행하여결과를분석한후, 시사점을도출하고자하였다. -562-
표 2 정보시스템분야저널분류 (Chan et al., 2006) Journals Pure IS Hybrid IS MIS Quarterly Information Systems Research Journal of Computer Information Systems Information Systems Management Journal of Global Information Management Journal of Management Information Systems DATA BASE for Advances in Information Systems Journal of Information Technology Information Systems Journal Journal of Strategic Information Systems Information Systems Journal European Journal of Information Systems Information & Management Journal of the Association for Information Systems Expert Systems with Applications ACM Transactions on Database Systems International Journal of Human Computer Studies The Journal of Information Systems Human Computer Interaction Journal of Systems and Software Knowledge based Systems Behaviour Information Technology IEEE Transactions on Software Engineering Computers in Human Behavior Informs Journal on Computing IEEE Transactions on Knowledge and Data Engineering Datamation ACM Computing Surveys 표 3 정보시스템분야논문데이터수집결과 Year # of papers 3.1. 데이터수집 그림 2 텍스트마이닝프로세스 본연구는국제논문 (SCIE, SSCI, A&HCI) 을실시간검색가능할수있도록하는웹데이터베이스인 Web of Science 에서 1980 년부터 2015 년까지연구된약 35 년여간의정보시스템 (IS) 분야논문데이터를수집하였다. 수집된정보시스템분야전체논문수는총 48,102 개였으며, 그중순수정보시스템관련논문은 10,876 개그리고융합정보시스템관련논문은 37,226 개였다. 기존연구에서분류한저널카테고리는 < 표 2> 와같다. 저널카테고리에따라서수집된데이터결과는아래의 < 표 3> 과같다. 웹사이트를통해수집된데이터에는각종태그와마크업기호등이존재하였으므로, 총 48,102 건의데이터는전처리 (Preprocessing) 하여결과를도출해내고자하였다. 데이터분석시본연구와크게관련이없다고여겨지는형용사, 조사, 부사등을제거하는등의정제과정을거쳤으며, 문장경계인식, 자동띄어쓰기등형태소분석단계이전에필요한전처리과정을진행하였다 ( 함영균 et al., 2012). Pure IS Hybrid IS 1980-1989 476 1990-1999 2,246 2000-2009 4,619 2010-2015 3,535 1980-1989 4,832 1990-1999 8,147 2000-2009 9,741 2010-2015 14,506 Total 1980-2015 48,102 3.2. 데이터분석 3.2.1. 토픽모델링분석 현대사회에서정보량은기하급수적으로증가하는추세이다. 이에원하는정보를단번에찾는것이점점어려워지고있으며, 심지어대량의데이터내에서주어진데이터가어떤정보및가치를포함하고있는지파악하지못할때도있다. 따라서, -563-
2015 한국경영정보학회 추계통합학술대회 수많은 데이터를 탐색해 정보 추출을 도와주고, 숨겨진 패턴을 정리해주는 분석법이 필요하기에 이를 해결해줄 수 있는 토픽 모델링이 급속도로 부상하였다. 토픽 모델링이란 수많은 문헌 모델링 기법 중 대표적 분석법이다. 특히, 2003년 Blei가 제안한 초창기 토픽 모델링 기법 중 하나인 LDA (Latent Dirichlet Allocation) 알고리즘이 다양한 분야에서 활발히 적용되고 있는 추세이다. LDA 알고리즘은 문헌을 기반으로 하는 절차적 확률분포 모델로써 문헌은 특정 확률에 의해 선택된 단어들로 구성된 토픽들의 집합으로 표현된다 (Blei et al., 2003, 2012). 본 연구는 수집된 데이터에 들어있는 저널 명 (Journal), 논문 제목 (Title), 초록 (Abstract), 저자 (Author 1-10) 등의 정보를 토픽모델링 LDA 알고리즘으로 분석해 그에 대한 본 연구의 함의를 이끌어내고자 했다. 4.1.1. 순수정보시스템 토픽 (1980-1989) 본 연구에서는 <표 4>와 같이 1980년부터 1989년 약 10년 간 순수정보시스템 (Pure IS) 분야에서 연구된 논문 총 476개를 수집할 수 있었다. 위 데이터들을 토대로 LDA 알고리즘을 통해 아래와 같은 결과를 도출할 수 있었다. 각 주제에 해당하는 순수 정보시스템 중 논문 투고 빈도가 높은 핵심 연구 키워드 상위 20개를 요약한 결과이다. 표 4 순수정보시스템 토픽(1980-1989) 3.2.2. 네트워크 분석 토픽 모델링 수행 후 분석의 두 번째 단계로써 네트워크 분석을 수행하고자 했다. 네트워크 분석은 1930년대부터 인류학, 사회 심리학, 사회학 등 사회과학 분야에서 활발한 연구가 진행된 분석법이다 (정근하, 2011). 현재는 자연과학, 융합과학, 경영학 등 많은 분야에서 본 이론이 응용되고 있다. 그 중 사회 네트워크 분석 (Social Network Analysis, SNA) 또는 사회 연결망 분석법이 가장 많이 응용되어 왔다. 사회 네트워크 분석의 장점은 복잡한 관계 내에서 구조적 유사성을 탐색적으로 찾아낼 수 있다는 것이다. 또한, 분석 대상의 여러 가지 속성 (예: 성별, 직위, 소속 등)에 의해 개별 참여자들이 가지고 있는 구조적 특징을 통계 분석하여 설명할 수 있다는 점에서도 매우 유용하다. 본 연구에서는 위에서 언급된 네트워크 분석의 장점을 통해 정보시스템 학문 분야의 시대별 이슈가 되는 연구 키워드 (Research Keywords)와 그 시대 연구를 선도하고 있는 연구자 (Author) 속성을 활용하여 네트워크 분석법을 시행하였다. Ⅳ. 연구결과 4.1. 토픽 모델링 기반의 정보시스템 학문 동향 본 연구에서는 기존 연구되어온 정보시스템 학문의 논문 데이터를 가지고 텍스트 데이터의 구조를 통해 주제를 객관적으로 분석할 수 있는 토픽 모델링 기법 (Blei, 2003)을 활용하여 시간 경과에 따른 정보시스템의 핵심 개념에 대한 동향을 알아보고자 한다. 또한, 순수정보시스템과 융합정보시스템간의 동향을 비교분석하여 시사점을 제시하고자 한다. LDA 모델은 텍스트형식 데이터의 단어들과 구 조를 통해 문서를 테마로 분류하는데, 각 주제의 제 목은 연구자들에 의해 가장 빈번하게 쓰이는 단어들 로 추론하여 판단된다 (박자현 & 송민, 2013). 본 연 구는 1980~1990년의 순수정보시스템 핵심 연구 대하 여 시스템 분석, 효과, 조직, 요인, 상호작용, 인터페 이스, 컴퓨팅, 평가, 효율 그리고 기술의 10가지 주 제가 도출된 LDA결과를 이용한다. -564-
2015 한국경영정보학회 추계통합학술대회 4.1.2. 순수정보시스템 토픽 (1990-1999) 1990~1999년의 순수정보시스템 핵심 연구에 대한 LDA결과는 네트워크, 통합, 전략, 엔지니어링, 웹, 시스템, 생산성, 네트워크, 상호작용 그리고 분석의 10가지 주제로 도출 되었다 <표 5 참조>. 이러한 토픽모델링 결과는 네트워크 분석을 통해 기존의 순수정보시스템 연구 주제와 최근 각광받고 있는 융합정보시스템 주제가 어떻게 다르게 발전되어 가는지를 분석할 수 있는 기반이 되어 준다. 수집이 용이해졌다. 이에 정보시스템에서의 연구의 관심은 정보의 파급력에 있어 정보의 공유 관계, 기술, 영향력에 대한 부분이 주로 많았다. 표 6 - 순수정보시스템 토픽(2000-2009) 표 5 - 순수정보시스템 토픽(1990-1999) 4.1.4. 순수정보시스템 토픽 (2010-2015) 4.1.3. 순수정보시스템 토픽 (2000-2009) 2000~2009년의 순수정보시스템 핵심 연구의 토픽모델링 LDA결과는 다음과 같이 정보 기술, 네트워크, 정보, 인플루언스, 기술, 전략, 공유, 시장, 관계 그리고 지식이라는 주제로 도출 되었다 <표 6 참조>. 모바일 시장의 성장으로 정보의 생성과 2010~2015년에 연구된 순수정보시스템 논문에 대한 LDA결과는 제품 서비스, 커뮤니티, 융합, 온톨로지, 데이터, 정보, 경쟁, 시장, 최적화 그리고 모바일 기술이라는 10가지 주제로 도출 되었다 <표 7 참조>. 이러한 토픽모델링 결과는 최근 다양한 학문들이 정보시스템 학문과 융합을 이루어 새로운 연구와 기술을 창출해내고 있다는 것을 보여준다. 그리고 경쟁시장에 있어 제품과 서비스에 대한 발전뿐만 아니라 최적화에 중점을 둔 연구가 진행되고 있다는 것을 알 수 있다. -565-
2015 한국경영정보학회 추계통합학술대회 표 7 - 순수정보시스템 토픽(2010-2015) 표 8 - 시간에 따른 순수 정보시스템 토픽의 변화(1980-2015) 1980-1989 시스템분석 효과 조직 요인 상호작용 인터페이스 컴퓨팅 평가 효율 기술 1990-1999 네트워크 통합 전략 엔지니어링 웹 시스템 생산성 데이터베이스 상호작용 분석 2000-2009 정보기술 네트워크 정보 인플루언스 기술 전략 공유 시장 관계 지식 2010-2015 제품,서비스 커뮤니티 융합 온톨로지 데이터 정보 경쟁 시장 최적화 모바일기술 2000년대는 더욱 고급화된 정보화 기술을 통해서 IT 기반의 지식관리가 용이해졌으며, 시장의 유용한 정보와 지식 그리고 전략을 도출할 수 있는 데이터 마이닝 (Data Mining) 에 대한 연구가 활성화되었다. 마지막으로 2010년대를 보면, 스마트 비즈니스 시대 도래로 각종 모바일 기술과 소셜 미디어가 나타남에 따라, 각종 모바일 로그 데이터, 소셜 미디어 데이터 등 그야말로 실시간 적으로 데이터가 폭증하는 빅데이터 세상이 출현했다. 이로 인해 엄청난 양의 데이터 저장소를 구축할 수 있는 인터넷 상의 서버, 클라우드 컴퓨팅 (Cloud Computing) 기술이 발달했고, 이것이 곧 스마트 비즈니스 시대의 빅데이터 기술을 견인을 해온 것으로 확인할 수 있다. 그리고 최근에 들어서는 정보화 시대의 시장 경쟁력이 무조건적 기술 발전이 아닌, 고객이 100% 만족할 수 있는 최적화된 제품과 서비스가 무엇인가가 이슈가 되며 연구가 진행된다고 추론할 수 있다 <표 8 참조>. 4.2. 네트워크 분석을 기반으로 한 정보시스템 학문의 동향 분석 4.1.5. 순수정보시스템 토픽 (1980-2015) <표 8>를 보면 1980년대는 모든 기업이 당면하는 의사결정문제에 있어, 더욱 용이하고 효과적인 해결을 돕는 의사 결정 시스템(Decision Support System) 등 다양한 컴퓨팅 기술이 발전했다. 이처럼 당 시대에는 시스템 분석 체계에 초점을 둔 연구가 활발하게 진행되었다. 1990년대는 인터넷이 상용화 됨으로부터 웹 (Web) 이라는 가상 환경이 구축되었다. 동 시대에 기업의 비즈니스가 점점 오프라인에서 온라인으로 변화하면서 다양한 의견 수렴 및 비교가 가능하게 되었다. 이를 바탕으로 기업의 이윤을 최대로 창출하기 위한 IT 전략수립과 IT 기반 조직의 생산성 증대를 위한 연구가 진행되었다. 본 장에서는 기존에 연구되어온 정보시스템 학문의 논문 데이터를 통해 (1980-2015), 논문들이 가지고 있는 여러가지 속성 (예: 제목, 키워드, 저자명, 기간 등)을 활용하여 네트워크를 가시화하고, 특징적 관계를 분석한다. 1990-1999, 2000-2009, 2010-2015기간을 세분화하여, 각 연구의 키워드를 중심으로 한 네트워크 분석을 통해 정보시스템 학문의 동향을 파악하였다. 4.2.1. 네트워크 분석 (1990-1999) 이 절에서는 1990-1999년대, 약 10년 간 정보시스템 분야에서 연구되어온 논문을 중심으로 한 네트워크 분석 결과를 이야기하고자 한다. 먼저, Chan et al. (2014)의 연구를 활용해 정보시스템 논문의 갈래를 2가지 분야 (Pure IS와 Hybrid IS)로 분류한 후 논문의 키워드 중심, 논문의 키워드와 저자명 중심으로 네트워크 분석을 시행하였다. 시각화된 -566-
결과는 < 그림 3>, < 그림 4> 와같다. 분석결과, 첫째로순수정보시스템분야에서는동기간내 3,575 개의키워드가도출되었고, 키워드와저자명간에는 5,556 개의연결고리를발견할수있었다. 둘째, 융합정보시스템분야에서는동기간내 6,265 개의키워드가도출되었으며, 키워드와저자명간에는 10,730 개의연결고리를발견할수있었다. 위결과를비교해보았을때, 비교적정통적인정보시스템학문을연구하는순수정보시스템분야에비해, 타학문과정보시스템학문을융복합하여연구하는융합정보시스템분야가훨씬많은화두와키워드를가지고활발하게연구되고있음을알수있었다. 또한, 순수정보시스템분야에서는키워드와저자명간의연결고리가 5,556 개발견된것에비해, 융합정보시스템분야에서는키워드와저자명간의연결고리가 10,730 개연결되어있는것으로보아연구자들이훨씬활발한아이디어를가지고연구하고있는것으로분석되었다. 그러므로순수정보시스템분야보다, 타학문과융복합되어다양한소재의학문들이연구되고있는융합정보시스템이연구자들에게연구대상으로서많은각광을받고있다고생각된다. 도움을주는역할을하도록했다. 그외에도 Algorithms ( 알고리즘 ), Database ( 데이터베이스 ), Artificial intelligence ( 인공지능 ), Concurrency control ( 환율통제 ) 등과같은키워드가주로등장하였는데, 이는기존의순수정보시스템키워드와는다른양상을보이고있음을알수있다. 그림 4 Hybrid IS 1990-1999 Keyword 4.2.2. 네트워크분석 (2000-2009) 그림 3 Pure IS 1990-1999 Keyword < 그림 3> 을보면 Decision Support Systems ( 의사결정지원시스템 ) 이라는키워드를중심으로각연구자들이분포되어있는것을확인할수있으며 < 그림 4> 에서는 Performance ( 실적, 성과 ) 관련키워드를중심으로많은연구자들이네트워크를형성하여이들을중심으로관련연구들이행해지고있음을알수있다. 실제로 1990 년대부터기업에서는단순한데이터처리, 거래처리시스템을떠나 DSS (Decision Support System) 이라는시스템을도입하여, 의사결정을하는데있어일부 다음으로 2000 년대부터 2009 년대까지약 10 년간, IS 분야논문들의키워드를통한네트워크분석을진행하였다. 주목할만한분석결과는위기간대에 Electronic Commerce ( 전자상거래 ), Knowledge Management ( 지식경영 ), Data Mining ( 데이터마이닝 ) 과같은키워드에대한관심이높아지며활발한연구가진행되었다는것이다. 이에대한네트워크시각화결과는아래 < 그림 5> 와같다. 전반적으로 Electronic Commerce ( 전자상거래 ) 를큰토대로하고그것이세부적으로가지를치며, 연구가활발하게진행되고있는것을볼수있다. 특히, 하이브리드정보시스템네트워크분석결과를살펴보면, 주요키워드는 Association rules ( 연관규칙 ), Analysis of algorithms ( 알고리즘분석 ), Text mining ( 텍스트마이닝 ), Performance ( 성과 ), Machine learning ( 기계학습 ) 이었다. 2000 년대들어서텍스트마이닝과기계학습에대한관심도가증가하였다는점을파악할수있으며, 과거에비하여 분석 혹은 기계학습 과같이정보를처리하여새로운분야에응용할수있는부분들에대한연구로연구자들의관심주제가이동하였음을확인하였다. -567-
( 최적화 ), Collaboration ( 협업 ) 과같은키워드가중심적으로나타았음을알수있다. 2000 년대초반의융합정보시스템분석시등장한키워드구성과크게다른점은인공신경망과협업과같은키워드의새로운등장이다. 다른학문분야와의협업에대한관심이고조되었으며, 인공신경망에대한연구수요도함께증가하였음을확인할수있다 < 그림 8 참조 >. 그림 5 Pure IS 2000-2009 Keyword 그림 7 Pure IS 2010-2015 Keyword 그림 6 Hybrid IS 2000-2009 Keyword 4.2.3. 네트워크분석 (2010-2015) 본절에서는 2010 년부터 2015 년까지순수정보시스템분야에서다루어진논문의키워드를네트워크분석함으로써특징적으로도출된결과를논의해보고자한다. 2010 년에들어오면서부터순수정보시스템학문에서주로다루어진키워드로는 Algorithms ( 알고리즘 ), Decision support ( 의사결정지원 ), Cloud Computing ( 클라우드컴퓨팅 ), E-commerce ( 전자상거래 ), Virtual World ( 가상세계 ), Virtual Communities ( 가상공동체 ), Online Communities ( 온라인공동체 ) 가대표적이었다. 특징적으로, Decision support ( 의사결정지원 ), E-commerce ( 전자상거래 ) 는 2000 년대부터활발히연구되어왔고, 지금까지도많은연구가되어오는이슈이기에큰관심을받았다는점을확인할수있다 < 그림 7 참조 >. 또한, 융합정보시스템을네트워크분석시행하였을때, Classification ( 계층화 ), Clustering ( 군집화 ), Algorithms ( 알고리즘 ), Design ( 디자인 ), Artificial neural network ( 인공신경망 ), Optimization 그림 8 Hybrid IS 2010-2015 Keyword 4.2.4. 네트워크분석 (1990-2015) 1990 년도순수정보시스템학문은의사결정지원시스템에대한연구를진행하였으며, 그로인해다양한학문들이접목되어 어떻게의사결정지원시스템을연결하여, 더욱큰효율성과이윤을얻을수있는가? 에대해의문을가지고활발한연구를진행했다. 2000 년대에들어와서는데이터마이닝 (Data -568-
Mining) 이순수정보시스템학문에서큰화두가되면서, 다양한학문을데이터마이닝을통해분석, 조금더현명하고기발한인사이트를도출하기위한연구가증가했다. 2010 년이후에는점점우리의생활이스마트화되어데이터양이급증하고, 빅데이터기술또한더욱발달함에따라 클라우드컴퓨팅기술 이발달하였다. 그로인하여비정형정보, 정형정보등다양화된정보를더욱일목요연하게분류하고군집화하는 classification( 계층화 ) 과 clustering( 군집화 ) 기법이급속도로발전하기시작했다 < 표 9 참조 >. 표 9. 시간에따른순수정보시스템과융합정보시스템의핵심연구비교 (1990-2015) Pure IS Decision Support Systems 1990-1999 Hybrid Performance IS Electronic-Commerce, Pure IS Knowledge Management, 2000-2009 2010-2015 Hybrid IS Pure IS Hybrid IS Ⅴ. 결론및시사점 5.1. 결론 Data Mining Association rules, Analysis of algorithms Virtual World, Cloud Computing, Algorithms Classification, Clustering, Artificial Neural Network 본연구를통해기존의정보시스템분야에서연구자들이어떠한주제로연구해왔는지에대한흐름을파악할수있었다. 특히, 융합과학이각광받기이전의전통적인정보시스템분야, 즉, 순수정보시스템분야의저널에대하여토픽모델링분석을시행함으로써융합정보시스템분야에서네트워크분석을통해도출된주요키워드와비교 분석할수있는기반을마련할수있었다. 또한네트워크분석을통해순수정보시스템및융합정보시스템분야에서의관심분야가어떠한방향성을갖고이동하는지를분석할수있었으며, 그결과융합정보시스템분야에서 90 년대에는의사결정시스템에대한연구가중심을이루었다면, 2000 년대로넘어오면서부터보다융합적인측면을강조하는텍스트마이닝, 기계학습과같은주제가각광받기시작했음을알수있었다. 2010 년이후에는군집화, 협업등과같은주요키워드가새롭게등장하면서융합적측면과분화적측면이동시에주요연구주제로다루어져왔음을확인하였다. 이는토픽모델링을통해도출한기존의순수정보시스템주제와비교하였을때, 단계적으로 추가응용되어연구하는부분들이점차증가해왔음을보여준다. 이에본연구의분석결과를통해정보시스템분야에서의학문적연구를계획하는연구자들이연구동향및흐름을파악하여앞으로의연구방향성을확인할수있을것이라고본다. 5.2. 시사점 정보시스템학문의동향을살펴보고자한본연구에서도출된결과를기반으로다음과같은시사점을제시할수있다. 첫째, 이전까지는 IS 분야동향에대해토픽모델링, 네트워크분석을통한다양한연구가부족하였다. 이에본연구에서는기존의정보시스템논문에서다루어졌던주요주제들을파악하는데에서더나아가, 네트워크분석을통한데이터시각화로향후정보동향을제시하였다. 둘째, Chan et al. (2014) 의연구를활용해순수정보시스템 (Pure IS) 과융합정보시스템 (Hybrid IS) 이라는 2 개의분야로나누어분석하는새로운분석방법을채택했으므로이에의의를둘수있다. 과거에정보시스템학에서주로다루었던주제들을순수정보시스템으로구분하고, 융합과학이대두되고있는최근동향에맞추어타학문과융합된융합정보시스템분야를별도로분석하였다는데의의가있다. 셋째, 이전정보시스템분야의연구발전과정및향후해당분야의발전전망성을예측해볼수있는연구라할수있다. 이는앞으로정보시스템분야에서새로운연구를진행할다방면의연구자들에게연구주제를선정함에있어보다명확한방향성을제시해줄수있을것으로기대한다. Ⅵ. References [1] 박자현 and 송민. (2013). 토픽모델링을활용한국내문헌정보학연구동향분석, 정보관리학회지 30(1), pp. 7-32. [2] 정근하. (2011), 텍스트마이닝과네트워크분석을활용한미래예측방법연구, 한국과학기술평가원연구보고서 [3] 함영균, 임경태, Rezk, M., 박정열, 윤용운, and 최기선. (2012). Linked Data 를위한한국어자연언어처리플랫폼. 제 24 회한글및한국어정보처리학술대회, pp.16-20 [4] Blei, D., Ng, A., and Jordan, M. (2003). Latent dirichlet allocation, The Journal of Machine Learning Research, Vol. 3, pp. 993-1022. [5] Blei, D. M., Griffiths, T. L., and Jordan, M. I. (2010). The nested Chinese restaurant process and bayesian nonparametric inference of topic hierarchies, Journal of the ACM (JACM), Vol. 57, No. 2, pp. 7. [6] Blei, D. M. (2012). Probabilistic topic models, -569-
Communications of the ACM, Vol. 55, No. 4, pp. 77-84. [7] Gerrish, S., and Blei, D. (2010). A language-based approach to measuring scholarly impact., The 27th International Conference on Machine Learning, pp. 375-382. [8] Song, Min., and Kim, Suyeon. (2013). Detecting the knowledge structure of bioinformatics by mining full-text collections. Scientometrics, Vol. 96(1), pp. 183-201. [9] Chan, H. C., and Kim, H. W., and Tan, W. C. (2006). Information Systems Citation Patterns From International Conference on Information Systems Articles. Journal of the Association for Information Science and Technology, Vol. 57, No. 9, pp. 1263-1274. [10] Chan, H. C., Guness, V., and Kim, H. W. (2015). A method for identifying journals in a discipline: An application to information systems. Information & Management, 52(2), 239-246. -570-