인간 친화적인 컴퓨팅 시장의 도래 2008.09.01 컴퓨팅 단말의 소형화, 지능화, 유비쿼터스화가 진척되면서 키보드, 마우스 외에 인 간의 오감과 상황을 인식할 수 있는 휴먼 인터페이스 기술이 사용자 중심의 편리한 컴퓨팅 인터페이스 기술로 각광 받고 있다. 휴먼 인터페이스 기술은 유비쿼터스 환경 하에서 지식기반 서비스 비즈니스의 경쟁력을 높여줌과 동시에 소프트웨어 업체들에 게 새로운 사업 기회가 될 것으로 예상된다. 이에 따라 학제간ㆍ산학연간 공동 연구 의 필요성이 높아지고 있다. 휴먼 인터페이스로 무장한 컴퓨팅 환경의 도래 컴퓨터의 발달과 함께 키보드와 마우스로 대표되는 기계적인 인터페이스 방식은 부동의 자리를 지켜 왔다. 하지만 최근에는 인간의 시각, 청각, 촉각, 후각, 미각 등 오감을 컴퓨터 인터페이스 기술에 접목시킴으로써 시간과 공간의 제약을 극복하고 인간 친화적인 차세대 컴퓨팅 환경을 구축하려는 시도가 증가하고 있다. 이른바 인간 중심 인터페이스 혹은 휴먼 인터페이스로 불리우는 HCI(Human Centric Interface) 1) 가 새로운 컴퓨터 인터페이스로 부상하고 있는 것이다. 컴퓨팅 환경의 개인화, 감성화, 가상화가 가속화되고, 언제 어디서나 컴퓨팅 환경에 접속이 가능한 유비쿼터스 컴퓨팅이 확산되는 것이 HCI가 부상하고 있는 배경 요인이 되 고 있다. 또한 컴퓨팅 환경이 다양화, 소형화, 지능화, 복합화 되면서, 사용자 중심의 여러 가지 입출력 수단(인터페이스)을 제공하고 동시에 처리할 수 있는 능력이 요구됨에 따라 HCI에 대한 수요가 증가하고 있다. 특히 최근에는 HCI의 핵심 기술인 멀티모 달 인터페이스(Multimodal Interface) 2) 와 상황인지(Context-aware) 3) 기술이 결합 되면서 HCI 기술은 차세대 웹 및 유비쿼터스 컴퓨팅의 핵심 기술로 자리 잡아 가 1) HCI(Human Centric Interface)는 사람과 기계 사이의 인터페이스를 사람과 사람 사이처럼 자연스럽게 해주 는 휴먼 인터페이스에 속한 모든 기술을 총칭함. 2) 음성, 키보드, 스타일러스 펜 등의 입력방식과 음성, 그래픽, 비디오 등의 출력방식을 통해 인간과 컴퓨터가 서로 인터페이스 하는 방법을 의미함. 멀티모달 인터페이스를 이용하면 인간과 컴퓨터 사이의 인터페이스를 보다 사람과 사람 사이의 인터페이스와 유사하게 할 수 있어 사용자의 편의성이 높아진다는 장점이 있음. 3) 사용자의 서비스 환경, 즉 단말기의 성능이나 상태, 사용자의 기호/성향 정보, 주변 환경의 상태 등 서비스 이 용에 영향을 줄 수 있는 다양한 정보를 수집하고 가공하여 맞춤형 사용자 인터페이스와 정보를 제공해 주는 기술 -1-
고 있다. 음성인식/합성, 촉각 기술의 활용의 대중화 인간 중심의 휴먼 인터페이스 기술은 음성/청각, 영상/시각/모션, 촉각, 후각, 미 각 등 인간의 오감을 통한 인터페이스 기술과 상황인지 기술 등이 개발되고 있으 며, 최근에는 오감인식 인터페이스 기술과 상황인지 기술이 융합되는 모습까지 보 이고 있다. 그림 1 멀티모달 상황인지 인터페이스 자료: KT미래기술연구소, 휴먼인터페이스와 미래 유망기술, KISTI 2007 미래 유망기술 세미나(2007) 음성/청각의 경우 자연스러운 발성에 가까운 음성인식과 합성이 이루어지고 있으 며, 영상/시각/모션의 경우 동작인식, 안구인식, 문자인식 등이 중심이 되고 있다. 또한 촉각의 경우 멀티터치스크린, 햅틱(HAPTIC) 기능을 중심으로 기술 개발이 이 루어지고 있으며, 인간의 뇌파를 통한 인터페이스 등 연구 범위가 확대되고 있다. 표 1 인터페이스 음성/청각 오감형 인지 인터페이스 기술 기본 기능 자연스러운 발성에 대한 음성인식 기술과 풍부한 감정 표현이 가능한 음 -2-
영상/시각 제스처/모션 성 합성 기술 홍채 인식을 통한 개인 인증뿐만 아니라 동작인식, 안구추적 기능을 이 용한 인터페이스 제스처의 의미를 인지하며 이에 대한 감정(emotion)을 해석 촉각 후각 미각 오감융합 터치방식의 입력 및 감촉을 느끼는 신경자극에 의한 인터페이스 구현 발향기술 구현 및 디스플레이 방식에 대한 연구를 통해 실감형 인터페이 스를 구현 미각 처리기술을 이용하여 감별처리 및 디스플레이 기술연구로 실감 인 터페이스를 구현 여러 가지 오감인식 및 자극을 통하여 실감형 인터페이스 구현 생체신호 생체신호 및 뇌파를 이용한 인터페이스 구현 자료: DigiEco(www.digieco.co.kr), 안세열, 김학균, 정영준, 구명완 멀티모달 상황 인지 인터페이스의 최신 기술동향 전문가들은 현재 음성, 촉각, 시각 정보에 대한 인식 기술은 대중화되고 있으나 미각, 후각에 대한 기술은 상대적으로 미약한 상황으로 보고 있다. 음성 기술의 경 우 휴대폰과 내비게이션 등 모바일 기기를 중심으로 적용이 확산되고 있는 상황이 다. 특허청에 따르면 생체인식 휴대폰과 관련된 특허 출원 중에서 음성인식과 관련 된 특허가 가장 많은 비중을 차지하고 있는 것으로 나타났다. 지능형 언어통역 로 봇, 장애인용 홈페이지 서비스 등에도 음성인식/합성 기술이 적용되고 있다. 촉각 인식 기술의 경우 햅틱(HAPTIC) 기술이 휴대폰과 게임기(게임 현실감을 증 가시시기 위한 진동) 등에 적용되고 있으며, 터치스크린을 통한 입력방식에도 싱글 터치스크린에서 멀티터치스크린으로 진화가 진행되고 있다. 또한 시각 인식 기술의 경우 안구의 움직임과 깜빡임으로 마우스 역할을 수행하는 기술이 개발되어 장애인 용 컴퓨팅 기기에 적용되고 있다. 표 2 오감 기술의 적용 가능성 기술명 대표 기술 기술수준 적용가능성 적용 가능 대표 기술 융합 및 증강 영상인식 얼굴/홍채인식 보통 우수 로봇 영상+후각 영상 표현 및 전송 MPEG 우수 매우 우수 모든 분야 영상+촉각 -3-
음성인식 화자독립 우수 우수 로봇, 오락, 교육 음성 표현 및 전송 MP3 우수 우수 모든 분야 음성+후각 촉감 인식 온감/역감 우수 우수 교육, 오락 촉감+영상 촉감 표현 및 전송 역감/재질감 보통 우수 교육, 오락 촉감+후각 후각 인식 위험가스검출 낮음 우수 안전 후각+영상 후각 표현 및 전송 조합형 발향 아주 낮음 우수 오락, 전자상거래 후각+촉감 미각 인식 양주감별 낮음 우수 안전 미각 표현 및 전송 - 아주 낮음 보통 - 자료: 정보통신연구진흥원 차세대 휴먼 인터페이스의 오감정보처리기술 상황인지(Context-aware) 기술의 경우 구글과 아마존 등이 소프트웨어 기반 서 비스로 제공하고 있다. 아마존의 경우 사용자가 도서를 구입할 때, 사용자들의 구매 이력을 저장 및 분석하고 그 결과를 바탕으로 도서검색 및 도서구매 시에 추천도서 를 보여줌으로써 매출을 높이고 있다. 구글의 경우 키워드에 대한 링크 순위, 개인 의 검색이력 등의 웹 내비게이션 로그정보들을 데이터베이스화하고 분석하여 각 사 용자의 상황을 고려한 차별화된 검색 결과를 제공하고 있다. 최근에는 유비쿼터스 환경 속에서 다양한 센서와 네트워크를 기반으로 데스크탑 및 웹의 공간을 넘어 실제 공간에서 지능적 서비스를 제공하는 단계로 발전하면서 지능형 서비스의 핵심으로 점차 자리를 잡아가고 있다. MIT는 상황인지와 관련하 여 미래상황 예측 모델링 4), 현실 마이닝 5) 등의 기술 등이 향후 5년 이후 경제ㆍ사 회적 파급효과가 큰 유망기술이 될 것으로 예측하고 있다. 6) 선진국들이 휴먼 인터페이스 기술 개발을 주도 오감인식 및 상황인지와 같은 휴먼 인터페이스 기술들은 웨어러블, 가상, 감성, 지능형 컴퓨팅 등과 같이 차세대 컴퓨팅 환경의 핵심 기술이 되고 있으며, 이에 따 라 많은 대학과 기업들이 관련 기술 개발에 참여하고 있다. MIT, 버클리, 카네기멜 4) 예외적인 사건을 예상하고 이에 대처하기 위하여 데이터 마이닝과 기계학습을 결합시키는 기술. 교통, 예방의 학, 정치, 군사, 금융 등 다양한 분야의 의사결정자에게 유용한 정보 제공을 가능하게 함. 경험 및 분석적 관 찰을 통해 지식의 자동적인 습득ㆍ통합을 가능하게 하며 지속적인 자기개선이 이루어짐. 5) 데이터 마이닝 기법으로 핸드폰의 통화 정보를 분석하여 사용자의 인간관계, 행동특성 등의 유용한 정보를 찾 아내는 기술. 사용자 특성을 기반으로 사용자 중심의 인터페이스 개발에 적용할 수 있으며, 마케팅 전략 수립 시 과학적 데이터의 제공에 기여함. 6) MIT Technology Review 2008년 3/4월호 -4-
론, 캠브리지 등 세계 유수의 대학들과 Microsoft, IBM, AT&T 등 글로벌 IT 기 업, Nuance, Immersion 등이 있다. 우리나라에서도 음성인식/합성, 자연어처리, 상황인지 등의 분야를 중심으로 대학 들과 연구기관, 기업들이 기술 개발을 추진하고 있으나, 선진국에 비해서는 상대적 으로 취약한 상태이다. 상황인지 기술의 경우 전 세계 상황인식 컴퓨팅 연구의 약 60% 이상을 미국이 수행하고 있는 것으로 알려지고 있다. 7) 표 3 기술명 감성컴퓨팅 웨어러블컴퓨팅 음성인식/합성 자연어처리(NLP) 햅틱인터페이스 뇌파 및 사고인식 휴먼 컴퓨팅 인터페이스 관련 기술 연구/개발 기관 및 업체 업체명 MIT Media Lab, NCR VIA Tech, 자이버네트, Microvision, NetworkAnatomy, Vocera MIT, 카네기멜론대학, 캠브리지대학(음성인식연구소), IBM, Philps, AT&T, Microsoft, Nuance(Scansoft, Speechworks), 엘엔아이소프 트, HCI랩 등 Microsoft(Powerset), Google, 다이퀘스트, 코난테크놀로지, 코리아 와이즈넛 Immersion, SensAble Tech Brain Actuabed Tech, Neural Signals MIT, 조지아공대, 버클리대학, Xerox PARC, Microsoft, AT&T Bell 상황인지 Lab, SanSay, Active Badge System, 아주대학교, 성균관대학교, 광주과학기술원, ETRI, 한국통신 자료: 보도자료 정리 한편, 이러한 휴먼 인터페이스들은 과거 하나의 방식만이 적용되는 유니모달 (Unimodal)이 대부분이었으나 다양한 입출력 방식이 가능한 멀티모달(Multimodal) 로 진화하고 있다. 대표적인 멀티모달 인터페이스 기술에 대한 연구로는 W3C의 Multimodal Interaction Working Group이 있으며, IBM 주도의 X+V 8), Microsoft 의 SALT(Speech Application Language Tags), 그리고 OMA(Open Mobile Alliance)의 연구 등을 들 수 있다. 7) 한국정보사회진흥원, 상황인식 컴퓨팅의 현황과 전망, 2008 8) XML + VoiceXML -5-
현재, SmartKom System과 AT&T는 멀티모달 인터페이스 기술을 이용하여 멀 티미디어 콘텐츠를 검색하는 서비스를 제공하고 있다. 전문가들은 멀티모달 인터페 이스가 주로 홈네트워크 및 자동차 내비게이션 환경에서 지역 정보 검색, 프리젠테 이션 제어, IPTV 콘텐츠 검색 등에 주로 이용되고 있다고 설명한다. 또한 상황인지 미들웨어의 경우 온톨로지 기반의 Context 서버를 사용하여 상황 정보 지식을 공유하고 낮은 수준의 상황인지에서 높은 수준의 상황인지를 추론하려 는 방향으로 연구가 진행되고 있다. 온톨로지 기반 미들웨어의 대표적인 사례로 Gaia, SOCAM(Service-oriented Context-Aware Middleware), CoBrA(Context Broker Architecture) 등이 있다. 지식기반 서비스의 핵심 기술로 발전 오감인식(멀티모달), 상황인지와 같은 휴먼인터페이스 기술들은 사용자와 컴퓨터 사이의 정보 전달을 좀 더 빠르고, 자연스러우며, 편리하게 하는 사용자에게 초점이 맞추어진 기술들이다. 따라서 단순히 기술을 개발하고 사용자에게 적용시키는 기술 중심적인 방식보다는 사용자의 특성과 요구사항을 분석한 후 사용자의 요구에 부합 하여 이에 상응하는 기술을 개발하는 사용자 중심으로 접근해야 한다. 왜냐하면 휴 먼 인터페이스 기술은 사람의 신체로 비유하자면 모든 감각기관과 운동기관을 관장 하는 매우 중요한 의미를 차지하고 있기 때문이다. 웹 2.0 및 유비쿼터스 환경 하에서는 언제 어디서나 정보에 접근하기 위한 다양 하고 편리한 인터페이스의 제공이 필수적이다. 따라서 정보 입력과 출력을 위한 인 터페이스는 모든 휴먼 인터페이스 기술들이 하나의 플랫폼 안에서 통합되어 제공되 고, 모든 컴퓨터 및 IT기기에 공통적으로 적용되기 위해 플랫폼과 API가 개방될 것 으로 예상된다. 이에 따라 다양한 응용 분야(개인화, 감성화, 가상화 기반 서비스)의 개발이 활기를 띠게 될 것으로 보인다. 한편, 휴먼 인터페이스 기술들은 시맨틱 및 온톨로지 기술들과 접목되면서 보다 지능적이고 인간 중심적인 인터페이스를 제공 하는 방향으로 진화할 것으로 전망된다. 휴먼 인터페이스 기술은 단순히 기술로서만 한정되는 것이 아니라 소프트웨어 업 체들에게 새로운 시장 기회로 다가올 것으로 예상된다. 휴먼 인터페이스 기술이 IT 컨버전스, 유비쿼터스 컴퓨팅 환경과 지식기반 사회를 지향하는 지능형 지식 서비 -6-
스의 핵심 기술이 되고 있기 때문이다. 21세기 국가 및 기업의 경쟁력은 지식기반 서비스의 경쟁력에서 판가름된다고 볼 수 있다. 이에 따라 지식기반 서비스를 효율 적이고 편리하게 제공하기 위해 경쟁적으로 휴먼 인터페이스 기술 도입에 나설 것 으로 예상된다. 따라서 소프트웨어 업체들은 각각의 휴먼 인터페이스 개발은 물론 이거니와 휴먼 인터페이스의 통합 미들웨어 및 플랫폼 개발에 주력해야 할 것이며, 휴먼 인터페이 스를 통한 다양한 사용자 편의를 향상시키는 서비스 개발에 적극 나서야 할 것으로 분석된다. 이를 위해서는 소비자들의 참여를 기반으로 학제간(소프트웨어 공학, 사 회학, 심리학, 마케팅, 디자인 등) 및 산학연간 공동연구가 선행되어야 할 것이다. 크리에이티브 커먼즈 라이선스 이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-동일조건변경 허락 2.0 대한민국 라이선스에 따라 이용하실 수 있습니다. -7-