빅 데이터
|
|
- 영린 수
- 5 years ago
- Views:
Transcription
1 I. 배경 1 빅데이터의물결 (1) 빅데이터시대의도래 데이터가폭발적으로증가하고있다 년을기준으로 Twitter 에서하루에발생되는데이터의양이 8TB (Terabyte) 를넘어서는가했더니 2012 년에는 Facebook 에서하루에만 100TB 를넘는데이터가생성되고있다. 미국비행기제작사인보잉에서는비행기 1 대에관련된데이터가대략 640TB 에이른다고하니현재로서는그끝을알수없는정도이다. 끝없이커져가는디지털정보의단위를통해서도이러한현상이이제시작에불과함을짐작할수있다. 1 bit = binary digit 8 bits = 1 byte 1024 bytes = 1 Kilobyte 1024 Kilobytes = 1 Megabyte 1024 Megabytes = 1 Gigabyte 1024 Gigabytes = 1 Terabyte 1024 Terabytes = 1 Petabyte 1024 Petabytes = 1 Exabyte 1024 Exabytes = 1 Zettabyte 1024 Zettabytes = 1 Yottabyte 1024 Yottabyte = 1 Brontobyte 1024 Brontobyte = 1 Geobyte 우리나라의경우정확한수치는없지만카카오톡의문자메시지가 2012 년기준하루 1 억 8 천만건이라고 순수텍스트파일로만따져도최소한약 40GB 의데이터가매일매일쌓이고있을것으로예상된다.
2 (2) 빅데이터의특징 그러면이러한데이터의증가는단순히축적되는양만의문제일까? 이에대해오늘날데이터폭발의현상을흔히다음 V3C 로표현하고있다. Volume 데이터의양적증가 Velocity 좀더빨리! 즉, 실시간분석에대한요구의증가 Variety 기존의구조화된데이터와함께비구조적 (unstructured) 데이터의중요성이증대되었다. 대표적예가전문 ( 全文 ) 검색, 텍스트마이닝그리고동영상, 정지화상을포함하는패턴인식등이다. Complexity 위 3V와함께실시간정보제공의욕구가커지면서전반적으로데이터복잡도가증가하게되었다. 날이갈수록이러한현상은심화되고있다. 그동안무시되거나버려져왔던데이터는살아움직이는보물로재탄생하고온라인공간에서의모든클릭, 모든입력사항은하나의데이터흐름 (data stream) 으로기록, 보존, 분석되는세상이되었다. 오늘날길거리의 CCTV, 대중교통에서의요금지불및이동상태또한기록되고분석되는이러한현상은앞으로센서웹 (sensor web) 1 으로표현되는센서의보편화및사물간의통신 (Internet of Things) 등과함께가속화될것이다. 기존의데이터기가바이트 (GB) ~ 테라바이트 (TB) 중앙집중형구조적 (Structured) 빅데이터 (Big Data) 페타바이트 (Peta Bytes) ~ 엑사바이트 (Exa Bytes) 분산형비구조적 (Semi-Structured 및 Unstructured) 1 Sensor web 이란각종의센서데이터를인터넷망을통해적극적으로수집, 교환, 이용하려는노력을말한다. 특히 OGC (Open Geospatial Consortium: 에서는 SWE (Sensor Web Enablement) 라는프레임워크를제시하는데여기서는일련의웹서비스용 interface 와통신프로토콜을규정함으로써서로다른센서네트워크간의통신을가능케하고있다.
3 안정적인데이터모델 ( 주로관계형데이터모델 ) 체계적으로지정된 Interrupt 체계 Flat Schema 또는 No Schema 복잡다단한상호관계 빅데이터의가장큰특징은새로운처리방식을통해성능이비약적으로개선되었다는점이다. 어떤의미에서오늘날빅데이터를통해처리하는것은 30 년전에도이미모두처리가능하였던것이었다. 단지과거에는수개월에걸쳐작업해야했던것이이제몇시간 ~ 수일이면가능하게된것인데이것이가져온변화는가히새로운세상을예고한다해도과언이아니다. 기업의사결정의혁신과신상품개발프로세스의단축은물론사회적으로는유전자분석을통한개인별맞춤진단은의료보험체계의근본변화를가져올것이다. 보안상으로도실시간이미지처리를통한화상인식이이미실현되었고각종과학기술의변화는이제막시작고있다. 요컨대, 빅데이터를통한처리시간의단축, 비용의저렴화, 비정형데이터분석의실현등은단순히데이터 처리성능의개선이라는상대적, 산술적차원을넘어서서과거에생각지못하던것들을가능하게하고기존 전산의패러다임을바꾸어마침내사회적생활양식에까지영향주게된것이다.
4 2. 슈퍼컴퓨팅기술과분산컴퓨팅기술 (1) 슈퍼컴퓨팅 (HPC ) 기술 가. HPC 와분산컴퓨팅 흔히빅데이터라고하면갑자기새로운기술이탄생한것처럼생각하기쉽지만실제로는그동안지속적으로발전, 축적된기술의재탄생으로보는것이옳을것이다. 그중하나가슈퍼컴퓨터즉, HPC (High Performance Computing) 이다. 미국 CDC 의 Seymour Cray 가 1960 년대에소개한슈퍼컴퓨터는발전을거듭하여 20 세기에는초병렬슈퍼컴퓨터 (MPP: massively parallel supercomputer) 로거듭나게되었다. 여기서 MPP 란수천 ~ 수만개의프로세서를장착한대규모병렬컴퓨터를말하며 PC 에서는처리하거나분석할엄두를내지못하던것들도슈퍼컴퓨터에서는가능하여서많은분석업무와시뮬레이션등에이용되고있다. 슈퍼컴퓨팅은다음과같은형태로발전해왔다. 컴퓨터클러스터의구축 : 여러대의컴퓨터를밀결합 (tightly-coupled) 하여하나의클러스터를구축 MPP (Massively Parallel Processing) 기술 : 여러컴퓨터를느슨하게결합 (loosely-coupled) 해서성능을확대 그리드컴퓨팅 (Grid Computing): 여러대의원격지컴퓨터를연결한대규모분산형컴퓨팅그리고대표적인 HPC 구현방법으로다음의 2 가지를들수있는데이들모두가빅데이터기술의발전에직접적인영향을주었다. 병렬처리 (Parallel Computing) 기술 분산컴퓨팅 (Distributed Computing) 기술 한편슈퍼컴퓨터가가격도비싸지만그성능을제대로활용하기위해서는프로그래밍상의부가적작업이필요하다는점을간과할수없다. 즉, 슈퍼컴퓨터에서의프로그램개발을위해서는분산프로세싱을위한 MPI(Message Passing Interface) 나 PVM(Parallel Virtual Machine) 등과같은라이브러리를이용하여코딩하거나 Beowulf 와같은오픈소스솔루션을이용해야한다. 클러스터내의노드수만큼작업을분할하고이들상호간에메시지를전달하는방식으로병렬처리를진행시켜야하기때문이다.
5 뒤에서보듯빅데이터는기존의 HPC 의또다른모습이며특수용도에국한되었던슈퍼컴퓨터가대중화되어가는과정으로도볼수있겠다. 구체적으로다음의슈퍼컴퓨터요소기술이빅데이터에적용되었다. 나. 슈퍼컴퓨터요소기술의응용과빅데이터 슈퍼컴퓨터가빅데이터처리기술에기여한대표적인것은다음과같다. 데이터의획득과집적 (Data Aggregation) 데이터의규모가커지면한대의컴퓨터로저장하거나관리하기가힘들어지므로여러대로나누어이용한다. 빅데이터의대표격인 Hadoop에서는 HDFS라는독자적인분산파일시스템을기본으로하되 Lustre파일시스템과같은기존의고성능병렬파일시스템도손쉽게적용할수있게설계되었다. 데이터분석 (Data Analytics) 슈퍼컴퓨터에서수리연산중심의고급분석모델링기법이적용되어왔는데이들이론과분석모델이빅데이터분석작업의초석이되었다. 데이터시각화 (Data Visualization) 복잡한분석모델과대량의분석결과는전문가이외에이해하기가힘들었다. 따라서시각적표현특히동적표현 (Dynamic visualization) 을통해복잡한데이터구조체와이에대한수식연산의다차원결과를인간이이해하기쉽게시각화하는노력이있었고이또한빅데이터에그대로적용되었다. (2) 분산컴퓨팅과분산파일시스템 가. 분산컴퓨팅 분산컴퓨팅 (Distributed Computing) 이란여러대의컴퓨터를연결하여상호협력하게함으로써컴퓨팅의성능과효율을높이는것을말하는데넓은의미의분산컴퓨팅에는여러개의컴퓨팅자원을하나의시스템안에밀결합하여연결한병렬컴퓨팅까지포함시키기도한다. 분산컴퓨팅의기본적인목적은성능확대 (scalability) 와고가용성 (High Availability) 에있다하겠다. 우선컴퓨터의성능을확대시키기위한방식에는수직적성능확대 (Vertical scalability) 와수평적성능확대 (Horizontal scalability) 의 2 가지가있다. 수직적성능확대수직적확대는다음방식으로컴퓨터의성능을높히는것을말한다. 연산능력이보다강한 CPU로업그레이드 메모리, 하드디스크또는하드디스크컨트롤러 (HDC) 등을증설하거나고성능의것으로교체 통신연결을높은대역의통신회선으로업그레이드 I/O 측면에서 Non-blocking I/O와비동기적 I/O를적극도입 병렬프로그래밍모델의재설계 ( 예 : 메시지전달방식의개선 (MPI: Message Passing Interface), blocking/buffering 등 )
6 Event처리성능개선을위한제반조치수직적확대는 Scale-up 으로표현되며일단 HPC 에맞도록프로그램이개발되기만하면이후부터는시스템업그레이드시에도변경없이적용할수있는장점이있다. 반면컴퓨터의사양이높아질수록비용이기하급수적으로높아지게된다는단점이있다. 수평적성능확대반면수평적성능확대는다음방법으로컴퓨팅성능을높인다. 컴퓨터 (Node) 의추가 기능상 Peer-to-Peer모델과 Master-Slave 모델등의적용. 수평적성능확대를 Scale-out 으로표현하는데무엇보다기존투자를보호하고점진적인성능개선을추구할수있다는장점이있다. 예컨대 2 배의성능이필요하면여기에동일성능컴퓨터를몇대추가장착하는방식으로해결하는것이다. 고가용성의추구분산컴퓨팅을통한고가용성의추구는다음과같은방법을동원한다. 장애극복을위한 2중화와 Failover 기능추가및로드밸런싱 주요데이터의복제본을통한예방 나. 분산파일시스템 파일시스템이란데이터를물리매체에효율적으로저장, 관리하기위해만들어진유틸리티소프트웨어로서보통파일단위로관리한다. ( 반면에하위의물리매체에서는보통블록 (block) 단위로저장및전송한다. ) 이러한파일시스템은컴퓨터개발초기부터운영체제의일환으로발전해왔으며오늘날에도운영체제의연장선상에서지속적으로발전하고있다. 분산파일시스템은분산환경에서여러대의컴퓨터가파일시스템을함께이용할수있도록하는데초점이맞추어져있다. 즉, 다수사용자가원격의파일을이용할때불편을느끼지않도록하기위한각종투명성 (transparency) 의개념이핵심적요소가되고여기에복제 ( 데이터의복제및동기화등 ) 및캐싱 (caching) 기술을통해안정성과성능개선을도모하였다. 한편파일시스템에있어서도분산컴퓨팅에서와마찬가지로수평적및수직적확장방식이존재하는데최근에는이것이가상스토리지개념으로까지발전하였다. 분산파일시스템의대표적인것은다음과같다. NFS (Network File System) 1980년대초에개발된최초의분산파일시스템프로토콜로서네트워크드라이브를로컬컴퓨터의디렉토리로 mount하여사용하는방식이다. Lustre 병렬형분산파일시스템으로서대규모클러스터컴퓨팅에서주로이용되고있으며 GPL v2 라이센스에따른오픈소스이다. Luster( 러스터 라고읽는다 ) 는 Linux와 cluster를합성시킨명칭이며오늘날대부분의슈퍼컴퓨터에서사용중이다. 마이크로소프트의 DFS (Distributed File System) 마이크로소프트가 SMB를기반으로재구축한분
7 산파일시스템이다. GFS (Google File System) GFS 는 Google 이개발한독자적인분산파일시스템이다. ( 오픈소스가 아님 ). 이하에서우리는 GFS 에대해살펴본다. 빅데이터기술의기반이되기때문이다. GFS Google 은애당초부터검색포털로사업을시작하였으므로대규모데이터처리가필연적이었다. 또한벤처로시작한 Google 은저가 PC 를연결하는 scale-out 방식을채택했기때문에컴퓨터의하드웨어장애가불가피하였다. 특히수만대의컴퓨터로구성된대규모클러스터에서는개별컴퓨터의장애는이미예정된것이었고따라서개발당시부터다음과같은요구사항이설정되었다. 2 컴퓨터자체의장애대책과이를지원하는파일시스템의개선 대용량파일의지원할것. 특히웹페이지등의텍스트정보및이미지데이터와같은비구조적이고대량의데이터에대한효율적관리가용이할것. Write-once, read-many 및고성능파일추가 (Append) 기능 대규모의 streaming 기능 ( 특히 streaming read 작업 ) 3 이들요구사항을해결하기위해다음의설계상의원칙이채택되었다. 고정길이의파일단위 (64MB) 파일복제본 (replicate) 의적극적활용 Master-Slave 방식을통해한대의마스터컴퓨터가전체의메타데이터를관리한다. 데이터 caching기능은사용하지않는다. 파일시스템관련한 class의상속체계를정형화함으로써 snapshot, append 등의 custom API 개발을손쉽게하였다. 아래그림은 Google 에서발표한 GFS 논문 4 에실제수록된것으로서 GFS 의운영원리를잘보여주고있다. 2 실제로 Google 데이터센터의서버는대부분 CPU 당 4 core 미만이고 GPU 는장착되어있지않으며서버당메모리크기도 그리크지않다고한다. 또한 NAS 를거의사용하지않고서버들은일반 Ethernet 스위치로연결되어있다고한다. 3 Stream 에대해서는뒷부분 (III. 분석기법 3. 주요분석기법 (9) 스트림데이터 ) 에서자세히살펴봄. 4
8 뒤에보듯이이러한 GFS 의기술은상당부분 Hadoop 파일시스템에적용되어빅데이터기술의근간이 되었다.
9 3. BI 와데이터베이스 (1) BI (Business Intelligence) 가. 개요 BI 도빅데이터발전에중요한역할을하였다. 원래 BI 라는개념이출현하기이전에도 DSS (Decision Support System) 라는이름으로의사결정에서컴퓨터의지원을받고자하는연구가있었다. 주로중간관리자및최고경영자의전략의사결정에초점을맞추었던것으로서이것이이후 BI 로발전하였다 5. BI 를다음과같이분류할수있다. 구성솔루션설명 전략차원의 BI 분석차원의 BI 기존시스템의확장 BI 운영을위한인프라정보전달용 BI BSC VBM ABC OLAP ERP, CRM ETL DW Portal Balanced Scorecard. 균형성과관리. 조직의비전과전략목표실현을위해 4 가지 ( 재무, 고객, 내부프로세스, 학습과성장 ) 관점의성과지표를도출하여단기적성격의재무목표가치와장기적목표가치들간의조화를추구하는것. Value-based Management. 가치창조경영. 의사결정의기준을회계상매출, 이익중심에서벗어나기업가치중심으로자본수익률 (ROIC) 을사업평가의핵심기준으로삼는관리기법을말한다. Activity Based Costing. 활동기준원가계산. 간접비를합리적기준에서직접비로전환함으로써투입자원이제품또는서비스로변환되는과정을밝히는원가계산방식. On-line Analytical Processing. 다양한각도에서직접대화식으로정보를분석하는과정을말한다 ERP, CRM, SCM (Supply Chain Management) 등의솔루션이자신의기능을확장하여 BI 기능을제공하는것 Extraction-Translation-Loading. 기업의각종전산시스템에서데이터를추출하여정제 / 변환후데이터웨어하우스에적재하는것. Data Warehouse. 다양한운영시스템에서추출, 변환한후이를통합한데이터저장소 (repository) 를말한다포털. 인터넷접속시나타나는웹사이트라는의미로이용자가필요로하는다양한서비스를종합적으로모아놓은곳 년에 Gartner 의 H. Dresner 가여러관련개념을포괄하는용어로 "business intelligence" 라는용어를제안함.
10 BI 는다양한하위개념을가지는넓은개념이지만여기서우리가특히빅데이터와관련하여주목할것은데이터웨어하우스와 OLAP 이다. 나. DW/OLAP 과빅데이터분석 (Analytics) OLAP (Online Analytical Processing) 은 OLTP 에대응되는개념으로서 OLTP 가일상적 ( 즉, 반복되는 ) 거래의처리에대한것이라면 OLAP 은내외부의데이터를대상으로각종분석작업을해서원하는답을얻어내는것이다. 즉, 각종기법을이용해서정보를다양한각도에서분석하고자하는것이다. OLTP OLAP 대표적기능기간업무 (Operational) 시스템전사적 Data Warehouse 와부문별 Data Mart 데이터원천거래데이터중심다양한시스템에서추출, 변환 목적거래지원의사결정 데이터의특징데이터의삽입과수정질의 (Query) 업무프로세스상의세부사항 (snapshot) 최종사용자에의한짧고신속한수정및갱신표준화되고상대적으로단순한질의 여러측면이종합된다차원성 (Multidimensional) 상대적으로긴시간이소요되는 batch 성수정작업모델링이수반되는상대적으로복잡한질의 처리속도통상매우빠른응답성능개선을위해서는많은준비및처리시간이 소요. ( 수개월 ~ 수주일의준비가필요 ) 데이터크기 비교적데이터크기가비교적적음 ( 과거데이터는 archive) 통계작업등을위해많은양의데이터를다루는 경우가대부분 DB 설계수많은 DB 테이블을정규화다차원모델링통한 cube 설계 백업과복원 실시간데이터처리를위해백업이 필수 정기적백업대신해당데이터소스의재적재를 실시하기도함. 데이터웨어하우스 6 는분석을위해모든데이터를한곳에모아놓은것으로서그때의데이터베이스는 OLTP 의그것과는성격을달리하게된다. (OLAP 에서는다차원분석을위한 Cube 설계를하는반면 OLTP 에서는 DB 테이블의정규화를주된작업으로한다.) 6 DW 에대하여는뒤의 V. 빅데이터적용방법론 Hadoop 과 DW 에서자세히살펴본다.
11 뒤에보듯빅데이터가당초에는검색시스템과관련하여시작되었지만이후의발전과정및주된활용에는 BI 와밀접한관련을가지게되었다. 특히이러한현상은빅데이터를구축한이후의분석단계에서두드러진다. 빅데이터에 DW/OLAP 의경험이그대로반영되었으면서도또한각자독자적특징을가지는데아래에서빅데이터와 DW 를비교하였다. 데이터의특징데이터모델 Data Warehouse 구조적 (atomic, structured) 데이터 Cube 설계 = Fact 테이블 + Dimension 테이블 빅데이터비구조적데이터또는 semi-structure Bulk 데이터형태 (key, value) 형태로단순화하여대상데이터영역을확장 특기사항 빅데이터의영역이급속히확장하여기존 DW 의영역으로급속히밀어들어가는현상을보임 (2) 대규모데이터베이스와 NoSQL DB 가. 대규모데이터베이스 (Large Database) 본서의주제가빅데이터라면빅데이터베이스도존재하는가? 오늘날 Small database 와 big database 라는것을따로구별하지는않는다. 그러나기존데이터베이스보다훨씬큰규모를대상으로한대형의데이터베이스영역이존재하는것은사실이다. 소형데이터베이스증형데이터베이스대형데이터베이스 메인메모리에서만운영한대의서버에서운영여러대서버에서운영 DBA 없이사용 1~2 명의 DBA 여러사람의 DBA 10 만개이하의 record 10 만개 ~1000 만개의레코드 1000 만개 ~ 수십억개의레코드 데이터 <10 GB 이하 10GB ~ 40GB > 40GB No Partitions 최소한의 Partitioning 대규모의분할처리 7 7 샤딩 (Sharding) 은데이터베이스를여러개의 DB 서버로분할하여분산처리하는기법이다. 구체적분할기법은다음과 같이다양하다.
12 대규모데이터베이스에서는무엇보다성능이슈가가장크며이를위해대규모의분산클러스터환경의구축과함께특별한형태의 index 관리기술이동원한다. 심할경우에는관계형자체를포기하고데이터간의 consistency 모델을훨씬완화함으로써앞서언급한수평적확장과고가용성을추구하기도한다. 최근특화된대형데이터베이스로서관심을모으고있는것은다음과같다. HBase Cassandra Vertica CloudTran HyperTable 장점 Key 기반 Key 기반 SQL 기반 OLTP 특화속도가매우 NoSQL NoSQL 빠름 단점어렵다, 어렵다, 특정업체 특정업체 아직초기 Tool 부족 Tool 부족 기술 귀속기술 특기 사항 오픈소스오픈소스상용 (HP) 상용오픈소스 이러한빅데이터베이스의새로운기류를총괄적으로나타내는개념은 NoSQL 데이터베이스라하겠다. 나. NoSQL DBMS 빅데이터에서는비정형데이터가큰비중을차지하기때문에정형화된 (atomic) 데이터를중심으로한기존의관계형데이터베이스는적합하지않은경우가많다. 이에대해여러대안이제시되었고그중에서도 NoSQL 데이터베이스가큰반향을얻고있다. NoSQL 데이터베이스는대부분 Key 와이에대응되는 Value 형태로 즉, (Key, Value) 의 pair 로 데이터를관리한다는특징을가진다. key-value pair란? key-value pair (KVP) 란서로연관성을가진 2 개데이터로이루어진집합으로서이때 key 는고유한값을가지는식별자이고 value 는 key 에의해식별된데이터또는그에대한주소값을말한다. 예컨대 key 가이름 (name) 이라면 value 는그이름에해당되는내용물인것이다 방법설명특징 Vertical Partitioning 영역 (Range) 기반 Partitioning Key 또는 Hash 기반의 Partitioning 테이블별로서버를분할하는방식 Table 크기가커질때서버를분리하는방식 Hash 함수의계산값에따라서버를선정 구현이간단하고, 전체시스템에큰변화가필요없으나데이터가거대해지면추가샤딩이필요데이터를분할하는방법이예측가능해야함 Hash 함수의선정이중요함
13 Key-value pair 는흔히참조표 (lookup table), 해쉬테이블 (hash table) 등을통해구현되는데넓게 보면프로그램상의모든변수와변수값의지정도일종의 key-value pair 라고할수있을것이다. 예를들어다음과같이기술된상황을가정해보자. key country city year value 대한민국서울 2013 년 구체적표기방법은솔루션에따라다르지만 MongoDB 및 Python 의경우다음과같이표현한다. { "country" : " 대한민국 ", "city" : " 서울 ", "year" : 2013 } Java 의경우여러가지방법이있으나대표적인것은 Map 을이용하는것이다. 즉, Map 을실행시킨 HashMap ( 비동기화 ) 과 HashTable ( 동기화 ) 를이용하면된다. 예컨대다음과같이하면된다. Map map = new HashMap(); map.put("country", " 대한민국 "); map.put("city", " 서울 "); map.put("year", 2013); 해쉬테이블 (hash table) 한편 (Key, Value) pair 의동작원리를이해하기위해서해쉬테이블을이해하는것도중요하다. 이러한 해쉬테이블의동작원리가빅데이터의 (key, value) pair 의내부동작원리에그대로구현되기때문이다. 우선해쉬테이블이란 key 를효율적으로저장하고관리하기위해만들어진일종의참조표 (lookup table) 이다. Hash 테이블은해싱함수에의해만들어지며이함수에의해 key 를소위 hash bucket 에저장한다. 이때 bucket 이란 key value pair 의목록이다. 사용자가특정 key 로이에해당하는 value 를찾으려할때 key 를가지고 bucket 을뒤져서해당 key-value pair 를찾게된다. 여러개의 key 가하나의 bucket 에해당될수도있으므로 hash 테이블설계의목적은최대한골고루 key-value pair 를분배하는것이다.
14 NoSQL DBMS 는대용량의데이터처리및비정형의데이터베이스에특히적합하며프로그래밍도용이하고성능또한탁월하다. 이처럼 SQL 이외의방식으로데이터를조회 (Query) 한다는의미로이름붙여진 NoSQL 은최근기존의관계형데이터베이스의 SQL 까지도포함하는개념으로확장되면서 Not Only SQL 로확장해석하게되었다. NoSQL 데이터베이스의 4가지종류구체적구현방식에따라다음과같이분류할수있다. key-value store 모델 : key/value lookup 방식으로데이터를관리하는데 Amazon의 Dynamo가대표적이다. Column Families: Google BigTable 논문에서제시된것으로서각각의 key를여러개의 attribute (column) 에연결시킴으로써 column은일종의 hybrid row/column을저장하게된다. HBase, Cassandra가대표적예이다. 문서 (Document) 중심데이터베이스 : semi-structured 형태 ( 예를들어 JSON 8 ) 의문서로데이터를저장하는데 CouchDB, MongoDB가이에속한다. 그래프데이터베이스 : 그래프이론에의거하며 Neo4j 등이있다. 빅데이터의대표격인 Hadoop 에서의데이터베이스는 HBase 이며 Google 의 BigTable 을상당부분 모방하였다. 또한 Cassandra 는 HBase 에가장근접한것으로서 BigTable 과 Dynamo 의혼합 솔루션 이라할수있다. (HBase 등의 NoSQL 데이터베이스에대해서도뒤에서설명할예정임 ) 제품별특징을다음표에서정리해보았다. 8 JSON (JavaScript Object Notation) 은사람과컴퓨터가모두이해할수있도록설계된텍스트기반의데이터교환의표준이다. JavaScript 언어의표준에따라제정되었으나다른어떤컴퓨터언어에서도이용이가능하다. 객체를스토리지에저장하거나네트워크상으로전송하도록변형 (serializing) 하는것이용이하고구문도간략해서 XML 을대체하는기술로도인기를얻고있다.
15 장단점 HBase Cassandra Vertica MongoDB Hyper-Table 장점 Key 기반 Key 기반 Closed- Document- HBase 대용, NoSQL, NoSQL, source, oriented. 모든 오픈소스, 빠름 Cloudera 지원 Amazon SQL 표준, 사용 속성에 full-index 지원 용이, 가상화 제공 도구, 질의어가 다소복잡. 단점 어렵다, tool 어렵다, tool 벤더에의존 Arbitrary 데이터 후발주자. 부족, 단순한 queries 부족, 단순한 queries 타입에는제한적적용 아직검증이완벽하지않음 비고 신규로 설치가 기존 SQL 기반 성숙 대안으로검토하는 적용하면좋은 까다로움. appl. 을 것을권장 솔루션이됨 HDFS 와 확장하는데 독립적, 완전 용이 분산시스템 SQL 과비교 관계형데이터베이스에서는데이터에게 ACID 9 기준을요구하면서주제별로 Table 을만들고이들상호간의관계를 relation 으로규정한다. (RDB 에서의 relational 이란바로이러한테이블상호간의관계를뜻하는것이다.) 그리고이러한 DB 에대한질의어로 SQL 문을이용한다. SQL 이란일종의고급선언문 (high-level declarative language) 으로서구조화된데이터에대해사용자가제시하는질의어로서 10 다음몇가지단계를거쳐처리된다. 9 Atomicity (All or Nothing), Consistency (referential integrity 문제 ), Isolation 및 Durability 를의미하며 transaction 처리시의지침이된다. 10 그러나 SQL 과 Hadoop 은기능상보완적측면이있다. SQL 을 Hadoop 위에서사용하도록하는확장모듈이개발되고있기때문이다.
16 질의사항수동입력 Query parsing Query 분석 Query 최적화 Query 실행 결과출력 그런데 RDB 가정규성 (normalization) 규약을철저히준수해야했던반면 XML, JSON 같은형태는인위적변형을통해서처리해야했다. 반면빅데이터에서는비정형데이터의비중이높아서관계형 DB 와는다른방식으로데이터를처리해야했다. 즉, 빅데이터에서는데이터의구체적처리방식을프로그램으로작성하고실행한다. 이때데이터를 <key, value> 로표현하고데이터의처리작업의순서역시사용자프로그램에서지정한다. 결국 SQL 에서의질의어해석과실행계획까지사용자 ( 개발자 ) 가직접지시하는것이다. 빅데이터 ( 내지 NoSQL) 은역설적이게도이런점때문에훨씬다양하게데이터를표현할수있으며 concurrency 제어도편리해지고획기적으로성능이개선되었다.
17 4. Google 과 Apache 프로젝트 (1) Google 빅데이터 역사에서 BC ( 기원전 ) 과 AD ( 기원후 ) 로나누어시대구분하는것에빗대어정보기술발전단계별로시대구분시도가있었다. 즉, 컴퓨터이전 (BC: Before Computer) 과컴퓨터이후 (AC: After Computer) 로나누거나인터넷이전 (BI: Before Internet) 과인터넷이후 (PI: Post Internet) 으로나누기도하였는데. 11 설득력있는설명중하나가 Google 의등장이라할수있겠다. 특히검색회사인 Google 은모든작업에수학이론을깊숙이접목하고웹을대상으로방대한프레임워크를구축하였다. 12 빅데이터역시시작점에는 Google 이자리잡고있다. 서비스초기부터빅데이터에대한연구가있었는데이노력은단지 MapReduce 나 GFS 에그치지않고계속되어방대한프레임워크를구축하였다. 각구성모듈 (stack) 의대략적인내용은다음과같다. GFS: 데이터저장 MapReduce: 데이터처리 MyDQL gateway: 데이터입력 (ingest) BigTable: 대규모데이터제공 Sawzall: 도메인특화언어 (DSL: domain specific language) Evenflow ( 왼쪽 ): 복잡한 workloads의연결 Evenflow ( 가운데 ): 스케쥴링 Dremel ( 오른쪽 ): Columnar storage + 메타데이터 Dremel ( 왼쪽 ): End user의데이터질의 (query) Chubby: 시스템내에서의조정 11 보통과학학술및국방용으로만사용되던인터넷백본망의상용화 ( 보통 1994 년 ) 를기점으로함. 12 한편구글에서는특히검색에서의 PageRank 알고리즘에선형대수이론을이용하였다. 뿐만아니라광고의경매에 Game 이론을그리고 Google Maps 에그래프이론을이용하는등수학을적극활용하였다. 요컨데수학은 Google 의모든제품과 서비스에있어핵심적역할을한다고하겠다.
18 이러한 Google 의빅데이터관련프레임워크를일종의참조모델로하여다수의유력한인터넷회사역시 각자나름의개발을시작했다. 그리고이들결과물은고스란히오픈소스화하였으며상당수는 Apache 프로젝트로등재되어전세계개발자의적극적인참여를유도하였다. Sqoop는일종의 SQL to Hadoop 으로서 JDBC 데이터베이스를 Hadoop으로 import하는기능을가진다. Cloudera가개발. Pig는 Dataflow 지향의고급언어인 Pig Latin의컴파일러이다. Hive는 SQL기반의데이터웨어하우스로서 Facebook이개발. Oozie는 Hadoop의 job에대한워크플로우 /coordination 서비스소프트웨어로서 Yahoo가개발하였다. 이상을포함한모든소프트웨어의개발은각회사가주도하였지만 Apache 프로젝트에등재한오픈소스소프트웨어라는공통점을가진다. 결과적으로일반인으로서는빅데이터에대한거대한프레임워크를 Apache 오픈소스로서이용하거나참여할수있게된것이다.
19 (2) Apache 빅데이터프로젝트 빅데이터를효율적으로처리하려는노력은 Hadoop 이전에도있었고현재에도다양한시도가이루어지고있다. 13 그러나이후논의는주로대표적빅데이터프로젝트인 Hadoop 및이와관련된주요 Apache 프로젝트를중심으로진행될예정이다. 다만한가지유념할것은 Hadoop 의 MapReduce, HDFS, HBase 등이중심적위치를차지하기는하지만전체적관점에서는약 20 여개의관련프로젝트가거미줄처럼연결되어있으며지금이순간에도지속적으로새로운프로젝트가제안되거나채택되고있다는점이다. 14 따라서전체적균형을유지하면서 Hadoop 프로젝트를접근하는것이중요하다. Hadoop 을중심으로살펴보면아래그림에서보는바와같이 HDFS 와 MapReduce 를핵심 (core) 으로 하고여기에 HBase, Pig, Hive 등을비롯한수십가지의관련프로젝트가밀접하게연결되어있다. 이제다음장에서이들각각을소개하기로한다. 13 예컨대다음의 Hadoop Fatigue 라는논의를살펴볼것. 한편또다른대표적빅데이터프로젝트로 HPCC Systems 를들수있는데 ECL 이라는자체언어기반의프로그래밍모델을통해빅데이터처리를시도하고있다. ( 참조 ) 14 Apache 프로젝트는심사후 Incubation 프로젝트가되고이후일정한절차를거쳐본프로젝트로등재된다. 최근우리나라개발자가중심이된빅데이터에근거한데이터웨어하우스프로젝트인 tajo 가 incubation 프로젝트로선정된바있다. ( )
: Hadoop 출간 은 출판 분 2013 년 10 월 3 윤 퍼플 주 울 종 종 1 1번 윤 2013 본 전부 반 부를 재 권 동를 셔 면 OpenWithNet 총 상 술 워크 (2006 년) : Hadoop 세만 NoSQL 웹 분
빅 데이 Hadoop과 분석법(Analytics) 지은이 윤형 : Hadoop 출간 은 출판 분 2013 년 10 월 3 윤 퍼플 주 울 종 종 1 1번 www.kyobobook.co.kr 윤 2013 본 전부 반 부를 재 권 동를 셔 면 OpenWithNet 총 상 술 워크 (2006 년) : Hadoop 세만 NoSQL 웹 분 (2013 년) 세 인넷 (근간)
More information분야의 컨설팅과 교육, 그리고 분야별 전문가 모임을 통해 지속적인 상호 발 오늘날의 빅데이터 물결은 2004년 Google의 논문이 발단이 된 Hadoop 프로젝트로부터 시작되었다. 그러나 이러한 빅데이터 기술이 갑자기 생겨난 것은 아니다. 전을 꾀하고 있습니다. 야의
분야 컨설팅과 교육, 그리고 분야별 전문가 모임을 통해 지속적인 상호 발 오늘날 빅데이 물결은 2004년 Google 논문이 발단이 된 Hadoop 프로젝트로부 시작되었 그러나 이러한 빅데이 술이 갑자 생겨난 것은 아니 전을 꾀하고 있습니 야 책을 지속적로 출간하고 있습 한편로 분산컴퓨팅과 NoSQL 데이베이 등이 모태가 되었고, 다른 한편에서 데이 마이닝
More informationDB진흥원 BIG DATA 전문가로 가는 길 발표자료.pptx
빅데이터의기술영역과 요구역량 줌인터넷 ( 주 ) 김우승 소개 http://zum.com 줌인터넷(주) 연구소 이력 줌인터넷 SK planet SK Telecom 삼성전자 http://kimws.wordpress.com @kimws 목차 빅데이터살펴보기 빅데이터에서다루는문제들 NoSQL 빅데이터라이프사이클 빅데이터플랫폼 빅데이터를위한역량 빅데이터를위한역할별요구지식
More informationCONTENTS Volume.174 2013 09+10 06 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관
방송 통신 전파 KOREA COMMUNICATIONS AGENCY MAGAZINE 2013 VOL.174 09+10 CONTENTS Volume.174 2013 09+10 06 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내
More informationPowerPoint 프레젠테이션
Spider For MySQL 실전사용기 피망플러스유닛최윤묵 Spider For MySQL Data Sharding By Spider Storage Engine http://spiderformysql.com/ 성능 8 만 / 분 X 4 대 32 만 / 분 많은 DB 중에왜 spider 를? Source: 클라우드컴퓨팅구 선택의기로 Consistency RDBMS
More information빅데이터_DAY key
Big Data Near You 2016. 06. 16 Prof. Sehyug Kwon Dept. of Statistics 4V s of Big Data Volume Variety Velocity Veracity Value 대용량 다양한 유형 실시간 정보 (불)확실성 가치 tera(1,0004) - peta -exazetta(10007) bytes in 2020
More informationDW 개요.PDF
Data Warehouse Hammersoftkorea BI Group / DW / 1960 1970 1980 1990 2000 Automating Informating Source : Kelly, The Data Warehousing : The Route to Mass Customization, 1996. -,, Data .,.., /. ...,.,,,.
More informationUbiqutious Pubilc Access Reference Model
Hadoop/Hbase 기반의 Twitter 공간정보분석 군산대학교컴퓨터정보공학과 {pseudo_jo, didvuddn, kwnam}@kunsan.ac.kr 조현구, 양평우, 남광우 배경및필요성 Twitter 스트림에서의공간정보추출 - 공간현상의추출및공유부분은부족 Twitter 스트림에서의정보추출 - 자연어기반텍스트정보셋에서의키워드추출 - 시간의변화에따른이슈변화모니터링
More information김기남_ATDC2016_160620_[키노트].key
metatron Enterprise Big Data SKT Metatron/Big Data Big Data Big Data... metatron Ready to Enterprise Big Data Big Data Big Data Big Data?? Data Raw. CRM SCM MES TCO Data & Store & Processing Computational
More information항목
Cloud 컴퓨팅기반분산파일시스템개요 개발실 UPDATE : 2012. 11 18 INDEX 1. 가용성 2. 확장성 3. PrismFS 4. Q&A 2 가용성 3 Gmail 장애 2011년 2월 27일 34000명의 Gmail 사용자들이일어나보니메일, 주소록, 채팅기록등이사라진것을발견 2011년 2월 28일 스토리지소프트웨어업데이트를진행하는중 Bug로인해발생했다고공지
More informationIntra_DW_Ch4.PDF
The Intranet Data Warehouse Richard Tanler Ch4 : Online Analytic Processing: From Data To Information 2000. 4. 14 All rights reserved OLAP OLAP OLAP OLAP OLAP OLAP is a label, rather than a technology
More informationMicrosoft PowerPoint - CNVZNGWAIYSE.pptx
대용량데이터처리를위한 Sharding 2013.1. 이동현 DBMS 개발랩 /NHN Business Platform SQL 기술전략세미나 2 대용량데이터를위한솔루션은 NoSQL 인가, RDBMS 인가? 모든경우에대해어떤하나의선택을하자는게아닙니다. SQL 기술전략세미나 3 언제, 그리고왜 RDBMS 를선택해야하는가? NoSQL 과다른 RDBMS 만의특징이필요할때
More informationCover Story 01 20 Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치
Oracle Big Data 오라클 빅 데이터 이야기 Cover Story 01 20 Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치 최근 빅 데이터에 대한 관심이 커지고 있는데, 그 배경이 무엇일까요? 정말 다양한 소스로부터 엄청난 데이터들이 쏟아져
More information슬라이드 1
Data Warehouse 통합솔루션 회사연혁 Teradata Corporation (NYSE: TDC) 은 30 년이상업계를선도하며, 전세계적으로 Big Data 및데이터웨어하우스관련 Analytic 솔루션과컨설팅서비스를제공하는최고의기술을보유한 Global 기업 Teradata 본사 한국 Teradata 미국오하이오주 Dayton에세계최초의금전등록기제조사
More informationPortal_9iAS.ppt [읽기 전용]
Application Server iplatform Oracle9 A P P L I C A T I O N S E R V E R i Oracle9i Application Server e-business Portal Client Database Server e-business Portals B2C, B2B, B2E, WebsiteX B2Me GUI ID B2C
More informationBasic Template
Hadoop EcoSystem 을홗용한 Hybrid DW 구축사례 2013-05-02 KT cloudware / NexR Project Manager 정구범 klaus.jung@{kt nexr}.com KT의대용량데이터처리이슈 적재 Data의폭발적인증가 LTE 등초고속무선 Data 통싞 : 트래픽이예상보다빨리 / 많이증가 비통싞 ( 컨텐츠 / 플랫폼 /Bio/
More information이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론
이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론 2. 관련연구 2.1 MQTT 프로토콜 Fig. 1. Topic-based Publish/Subscribe Communication Model. Table 1. Delivery and Guarantee by MQTT QoS Level 2.1 MQTT-SN 프로토콜 Fig. 2. MQTT-SN
More informationMicrosoft Word - th1_Big Data 시대의 기술_ _조성우
Theme Article Big Data 시대의기술 중앙연구소 Intelligent Knowledge Service 조성우 1. 시대의화두 Big Data 최근 IT 분야의화두가무엇인지물어본다면, 빅데이터가대답들중하나일것이다. 20년전의 PC의메모리, 하드디스크의용량과최신 PC, 노트북사양을비교해보면과거에비해데이터가폭발적으로늘어났다는것을실감할수있을것이다. 특히스마트단말및소셜미디어등으로대표되는다양한정보채널의등장과이로인한정보의생산,
More informationWeb Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현
02 Web Application Hosting in the AWS Cloud www.wisen.co.kr Wisely Combine the Network platforms Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인
More informationETL_project_best_practice1.ppt
ETL ETL Data,., Data Warehouse DataData Warehouse ETL tool/system: ETL, ETL Process Data Warehouse Platform Database, Access Method Data Source Data Operational Data Near Real-Time Data Modeling Refresh/Replication
More informationecorp-프로젝트제안서작성실무(양식3)
(BSC: Balanced ScoreCard) ( ) (Value Chain) (Firm Infrastructure) (Support Activities) (Human Resource Management) (Technology Development) (Primary Activities) (Procurement) (Inbound (Outbound (Marketing
More informationCloud Friendly System Architecture
-Service Clients Administrator 1. -Service 구성도 : ( 좌측참고 ) LB(LoadBlancer) 2. -Service 개요 ucloud Virtual Router F/W Monitoring 개념 특징 적용가능분야 Server, WAS, DB 로구성되어 web service 를클라우드환경에서제공하기위한 service architecture
More information歯목차45호.PDF
CRM CRM (CRM : Customer Relationship Management ). CRM,,.,,.. IMF.,.,. (CRM: Customer Relationship Management, CRM )., CRM,.,., 57 45 (2001 )., CRM...,, CRM, CRM.. CRM 1., CRM,. CRM,.,.,. (Volume),,,,,,,,,,
More information빅데이터처리의핵심인 Hadoop 을오라클은어떻게지원하나요? Oracle Big Data Appliance Solution 01 빅데이터처리를위한전문솔루션이 Oracle Big Data Appliance 군요. Oracle Big Data Appliance 와함께라면더이
Cover Story 03 28 Oracle Big Data Solution 01_Oracle Big Data Appliance 02_Oracle Big Data Connectors 03_Oracle Exdata In-Memory Database Machine 04_Oracle Endeca Information Discovery 05_Oracle Event
More information초보자를 위한 분산 캐시 활용 전략
초보자를위한분산캐시활용전략 강대명 charsyam@naver.com 우리가꿈꾸는서비스 우리가꿈꾸는서비스 우리가꿈꾸는서비스 우리가꿈꾸는서비스 그러나현실은? 서비스에필요한것은? 서비스에필요한것은? 핵심적인기능 서비스에필요한것은? 핵심적인기능 서비스에필요한것은? 핵심적인기능 서비스에필요한것은? 적절한기능 서비스안정성 트위터에매일고래만보이면? 트위터에매일고래만보이면?
More information따끈따끈한 한국 Azure 데이터센터 서비스를 활용한 탁월한 데이터 분석 방안 (To be named)
오늘그리고미래의전략적자산 데이터. 데이터에서인사이트까지 무엇이? 왜? 그리고? 그렇다면? Insight 데이터의변화 CONNECTED DIGITAL ANALOG 1985 1990 1995 2000 2005 2010 2015 2020 데이터의변화 CONNECTED DIGITAL ANALOG 1985 1990 1995 2000 2005 2010 2015 2020
More informationOracle Apps Day_SEM
Senior Consultant Application Sales Consulting Oracle Korea - 1. S = (P + R) x E S= P= R= E= Source : Strategy Execution, By Daniel M. Beall 2001 1. Strategy Formulation Sound Flawed Missed Opportunity
More informationAmazon EBS (Elastic Block Storage) Amazon EC2 Local Instance Store (Ephemeral Volumes) Amazon S3 (Simple Storage Service) / Glacier Elastic File Syste (EFS) Storage Gateway AWS Import/Export 1 Instance
More informationRUCK2015_Gruter_public
Apache Tajo 와 R 을연동한빅데이터분석 고영경 / 그루터 ykko@gruter.com 목차 : R Tajo Tajo RJDBC Tajo Tajo UDF( ) TajoR Demo Q&A R 과빅데이터분석 ' R 1) R 2) 3) R (bigmemory, snowfall,..) 4) R (NoSQL, MapReduce, Hive / RHIPE, RHive,..)
More informationService-Oriented Architecture Copyright Tmax Soft 2005
Service-Oriented Architecture Copyright Tmax Soft 2005 Service-Oriented Architecture Copyright Tmax Soft 2005 Monolithic Architecture Reusable Services New Service Service Consumer Wrapped Service Composite
More information슬라이드 1
제 2 장 빅데이터기술 2015.02 조완섭충북대학교경영정보학과대학원비즈니스데이터융합학과 wscho@chungbuk.ac.kr 043-261-3258 010-2487-3691 목차 개요 빅데이터기술 클라우드컴퓨팅 Hadoop & Databases 데이터분석기술 다차원분석 통계분석 : R 데이터마이닝 빅데이터시각화기술 2015-07-23 2 개요 빅데이터 -
More information슬라이드 1
www.altsoft.co.kr www.clunix.com COMSOL4.0a Cluster 성능테스트 2010 년 10 월 클루닉스 / 알트소프트 개요 개요 목차 BMT 환경정보 BMT 시나리오소개 COMSOL4.0a MPP 해석실행조건 BMT 결과 COMSOL4.0a 클러스터분석결과 ( 메모리 / 성능 ) COMSOL4.0a 클러스터최종분석결과 -2- 개요
More informationDBMS & SQL Server Installation Database Laboratory
DBMS & 조교 _ 최윤영 } 데이터베이스연구실 (1314 호 ) } 문의사항은 cyy@hallym.ac.kr } 과제제출은 dbcyy1@gmail.com } 수업공지사항및자료는모두홈페이지에서확인 } dblab.hallym.ac.kr } 홈페이지 ID: 학번 } 홈페이지 PW:s123 2 차례 } } 설치전점검사항 } 설치단계별설명 3 Hallym Univ.
More informationAGENDA 01 02 03 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례
모바일 클라우드 서비스 융합사례와 시장 전망 및 신 사업전략 2011. 10 AGENDA 01 02 03 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례 AGENDA 01. 모바일 산업의 환경 변화 가치 사슬의 분화/결합 모바일 업계에서도 PC 산업과 유사한 모듈화/분업화 진행 PC 산업 IBM à WinTel 시대 à
More informationCRM Fair 2004
easycrm Workbench ( ) 2004.04.02 I. CRM 1. CRM 2. CRM 3. II. easybi(business Intelligence) Framework 1. 2. - easydataflow Workbench - easycampaign Workbench - easypivot Reporter. 1. CRM 1.?! 1.. a. & b.
More informationOZ-LMS TM OZ-LMS 2008 OZ-LMS 2006 OZ-LMS Lite Best IT Serviece Provider OZNET KOREA Management Philosophy & Vision Introduction OZNETKOREA IT Mission Core Values KH IT ERP Web Solution IT SW 2000 4 3 508-2
More information빅데이터시대 Self-BI 전략 이혁재이사 비아이씨엔에스
빅데이터시대 Self-BI 전략 이혁재이사 비아이씨엔에스 Agenda 1 Oracle In-Memory 소개 2 BI 시스템구성도 3 BI on In-Memory 테스트 4 In-Memory 활용한 BI 오라클인메모리목표 규모분석에대한속도향상 빠른속도 : 혼합워크로드업무 간편함 : 어플리케이션투명성및쉬운배치 저렴함 : 일부필요데이터만인메모리에존재가능 2 메모리운용방식
More informationuntitled
(shared) (integrated) (stored) (operational) (data) : (DBMS) :, (database) :DBMS File & Database - : - : ( : ) - : - : - :, - DB - - -DBMScatalog meta-data -DBMS -DBMS - -DBMS concurrency control E-R,
More informationInteg
HP Integrity HP Chipset Itanium 2(Processor 9100) HP Integrity HP, Itanium. HP Integrity Blade BL860c HP Integrity Blade BL870c HP Integrity rx2660 HP Integrity rx3600 HP Integrity rx6600 2 HP Integrity
More informationI. - II. DW ETT Best Practice
IBM Business Intelligence Solution Seminar 2005 - IBM Business Consulting Service (cslee@kr.ibm.com) I. - II. DW ETT Best Practice (DW)., (EDW). Time 1980 ~1990 1995 2000 2005 * 1980 IBM Information Warehouse
More informationModel Investor MANDO Portal Site People Customer BIS Supplier C R M PLM ERP MES HRIS S C M KMS Web -Based
e- Business Web Site 2002. 04.26 Model Investor MANDO Portal Site People Customer BIS Supplier C R M PLM ERP MES HRIS S C M KMS Web -Based Approach High E-Business Functionality Web Web --based based KMS/BIS
More informationOpen Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤
Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤 (byounggon.kim@opence.org) 빅데이터분석및서비스플랫폼 모바일 Browser 인포메이션카탈로그 Search 인포메이션유형 보안등급 생성주기 형식
More information비식별화 기술 활용 안내서-최종수정.indd
빅데이터 활용을 위한 빅데이터 담당자들이 실무에 활용 할 수 있도록 비식별화 기술과 활용방법, 실무 사례 및 예제, 분야별 참고 법령 및 활용 Q&A 등 안내 개인정보 비식별화 기술 활용 안내서 Ver 1.0 작성 및 문의 미래창조과학부 : 양현철 사무관 / 김자영 주무관 한국정보화진흥원 : 김진철 수석 / 김배현 수석 / 신신애 부장 문의 : cckim@nia.or.kr
More informationChap7.PDF
Chapter 7 The SUN Intranet Data Warehouse: Architecture and Tools All rights reserved 1 Intranet Data Warehouse : Distributed Networking Computing Peer-to-peer Peer-to-peer:,. C/S Microsoft ActiveX DCOM(Distributed
More informationTablespace On-Offline 테이블스페이스 온라인/오프라인
2018/11/10 12:06 1/2 Tablespace On-Offline 테이블스페이스온라인 / 오프라인 목차 Tablespace On-Offline 테이블스페이스온라인 / 오프라인... 1 일반테이블스페이스 (TABLESPACE)... 1 일반테이블스페이스생성하기... 1 테이블스페이스조회하기... 1 테이블스페이스에데이터파일 (DATA FILE) 추가
More informationPlatformDay2009-Hadoop_OSBI-YoungwooKim
Hadoop 과오픈소스소프트웨어를이용한비지니스인텔리전스플랫폼구축 (Building Business Intelligence Platform Using Hadoop and OpenSource Tools) PlatFromDay2009 2009. 6. 12 김영우 warwithin@daumcorp.com 다음커뮤니케이션 프리젠테이션개요 비즈니스인텔리전스그리고데이터웨어하우스
More informationNoSQL
MongoDB Daum Communications NoSQL Using Java Java VM, GC Low Scalability Using C Write speed Auto Sharding High Scalability Using Erlang Read/Update MapReduce R/U MR Cassandra Good Very Good MongoDB Good
More information1217 WebTrafMon II
(1/28) (2/28) (10 Mbps ) Video, Audio. (3/28) 10 ~ 15 ( : telnet, ftp ),, (4/28) UDP/TCP (5/28) centralized environment packet header information analysis network traffic data, capture presentation network
More information게시판 스팸 실시간 차단 시스템
오픈 API 2014. 11-1 - 목 차 1. 스팸지수측정요청프로토콜 3 1.1 스팸지수측정요청프로토콜개요 3 1.2 스팸지수측정요청방법 3 2. 게시판스팸차단도구오픈 API 활용 5 2.1 PHP 5 2.1.1 차단도구오픈 API 적용방법 5 2.1.2 차단도구오픈 API 스팸지수측정요청 5 2.1.3 차단도구오픈 API 스팸지수측정결과값 5 2.2 JSP
More informationU.Tu System Application DW Service AGENDA 1. 개요 4. 솔루션 모음 1.1. 제안의 배경 및 목적 4.1. 고객정의 DW구축에 필요한 메타정보 생성 1.2. 제품 개요 4.2. 사전 변경 관리 1.3. 제품 특장점 4.3. 부품화형
AGENDA 1. 개요 4. 솔루션 모음 1.1. 제안의 배경 및 목적 4.1. 고객정의 DW구축에 필요한 메타정보 생성 1.2. 제품 개요 4.2. 사전 변경 관리 1.3. 제품 특장점 4.3. 부품화형 언어 변환 1.4. 기대 효과 4.4. 프로그램 Restructuring 4.5. 소스 모듈 관리 2. SeeMAGMA 적용 전략 2.1. SeeMAGMA
More information<BFACB1B85F323031332D333728BCDBC5C2B9CE295FC3D6C1BEC8AEC1A45FC0CEBCE2BFEB28323031343031323029B8F1C2F7BCF6C1A42E687770>
연구보고서 2013-37 인터넷 건강정보 게이트웨이 시스템 구축 및 운영 -빅데이터 활용방안을 중심으로- 송태민 진달래 이중순 안지영 박대순 책임연구자 송태민 한국보건사회연구원 연구위원 주요저서 빅데이터 분석 방법론 한나래아카데미, 2013(공저) 보건복지연구를 위한 구조방정식 모형 한나래아카데미, 2012(공저) 공동연구진 진달래 한국보건사회연구원 연구원
More informationPowerPoint 프레젠테이션
03 모델변환과시점변환 01 기하변환 02 계층구조 Modeling 03 Camera 시점변환 기하변환 (Geometric Transformation) 1. 이동 (Translation) 2. 회전 (Rotation) 3. 크기조절 (Scale) 4. 전단 (Shear) 5. 복합변환 6. 반사변환 7. 구조변형변환 2 기하변환 (Geometric Transformation)
More informationMicrosoft PowerPoint - 6.pptx
DB 암호화업데이트 2011. 3. 15 KIM SUNGJIN ( 주 ) 비에이솔루션즈 1 IBM iseries 암호화구현방안 목차 목 차 정부시책및방향 제정안특이사항 기술적보호조치기준고시 암호화구현방안 암호화적용구조 DB 암호화 Performance Test 결과 암호화적용구조제안 [ 하이브리드방식 ] 2 IBM iseries 암호화구현방안 정부시책및방향
More informationSANsymphony-V
국내대표적인구축사례 (KR) XXXX공사(공공) 2013년 12월 도입 센터 이전에 따른 스토리지가상화 통합 및 이기종통합 이기종 스토리지 (무중단이중하) 무중단 서비스 확보 24시간 운영 체계의 고가용 확보 스토리지 인프라의 유연한 구성 및 통합 환경 구축 업무서버 Unix 20대 업무서버 V 58대 CIe SSD(Fusion IO 3.2TB) ㅇㅇㅇㅇㅇㅇ
More informationPowerPoint 프레젠테이션
In-memory 클러스터컴퓨팅프레임워크 Hadoop MapReduce 대비 Machine Learning 등반복작업에특화 2009년, UC Berkeley AMPLab에서 Mesos 어플리케이션으로시작 2010년 Spark 논문발표, 2012년 RDD 논문발표 2013년에 Apache 프로젝트로전환후, 2014년 Apache op-level Project
More information놀이동산미아찾기시스템
TinyOS를이용한 놀이동산미아찾기시스템 윤정호 (mo0o1234@nate.com) 김영익 (youngicks7@daum.net) 김동익 (dongikkim@naver.com) 1 목차 1. 프로젝트개요 2. 전체시스템구성도 3. Tool & Language 4. 데이터흐름도 5. Graphic User Interface 6. 개선해야할사항 2 프로젝트개요
More informationBeyond Relational SQL Server, Windows Server 에디션비교 씨앤토트 SW 기술팀장세원
Beyon Relational SQL Server, Winows Server 에디션비교 씨앤토트 SW 기술팀장세원 SQL Server 2012 Eition 비교 요약 항목 Enterprise Business Intelligence Stanar H/W 지원 고가용성 확장성및성능 보안 관리생산성 SQL Server Integration Services Master
More information歯부장
00-10-31 1 (1030) 2/26 (end-to-end) Infrastructure,, AMR. e-business e-business Domain e-business B2B Domain / R&D, B2B B2E B2C e-business IT Framework e-business Platform Clearance/Security * e-business
More informationGlobal Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항
Global Bigdata 사용 현황 및 향후 활용 전망 빅데이터 미도입 이유 필요성 못느낌, 분석 가치 판단 불가 향후 투자를 집중할 분야는 보안 모니터링 분야 와 자동화 시스템 분야 빅데이터의 핵심 가치 - 트랜드 예측 과 제품 개선 도움 빅데이터 운영 애로 사항 - 재직자 전문성, 복잡성으로 인해 알고리즘 개발 난항 본 조사 내용은 美 Techpro Research
More informationdbms_snu.PDF
DBMS : Past, Present, and the Future hjk@oopsla.snu.ac.kr 1 Table of Contents 2 DBMS? 3 DBMS Architecture naive users naive users programmers application casual users casual users administrator database
More informationPowerPoint 프레젠테이션
Why Microsoft Data Warehouse & BI? 아젠다 Ⅰ Ⅱ Ⅲ Ⅳ Microsoft Data Warehouse 소개 Microsoft Power BI 소개 Microsoft Data Warehouse & BI 구축사례메이븐클라우드서비스소개 Microsoft Data Warehouse 소개 Microsoft Data Warehouse 소개 Microsoft
More informationChapter 5 비즈니스인텔리젼스의기초 : 데이터베이스와정보관리
Chapter 5 비즈니스인텔리젼스의기초 : 데이터베이스와정보관리 Essentials of Management Information Systems Chapter. 5 비즈니스인텔리젼스의기초 : 데이터베이스와정보관리 학습목표 관계형데이터베이스가데이터를어떻게구성하고, 객체지향데이터베이스와어떠한차이가존재하는가? 데이테베이스관리시스템의원리는무엇인가? 기업의성과와의사결정력을향상시키기위한데이터베이스의정보에접근하기위한주요도구와기술들은무엇인가?
More information들어가는글 2012년 IT 분야에서최고의관심사는아마도빅데이터일것이다. 관계형데이터진영을대표하는오라클은 2011년 10월개최된 오라클오픈월드 2011 에서오라클빅데이터어플라이언스 (Oracle Big Data Appliance, 이하 BDA) 를출시한다고발표하였다. 이와
Oracle Data Integrator 와 Oracle Big Data Appliance 저자 - 김태완부장, 한국오라클 Fusion Middleware(taewan.kim@oracle.com) 오라클은최근 Big Data 분약에 End-To-End 솔루션을지원하는벤더로급부상하고있고, 기존관계형데이터저장소와새로운트랜드인비정형빅데이터를통합하는데이터아키텍처로엔터프로이즈시장에서주목을받고있다.
More informationRED HAT JBoss Data Grid (JDG)? KANGWUK HEO Middleware Solu6on Architect Service Team, Red Hat Korea 1
RED HAT JBoss Data Grid (JDG)? KANGWUK HEO Middleware Solu6on Architect Service Team, Red Hat Korea 1 Agenda TITLE SLIDE: HEADLINE 1.? 2. Presenter Infinispan JDG 3. Title JBoss Data Grid? 4. Date JBoss
More information슬라이드 1
강력한성능! 인터넷 / 업무용데스크탑 PC NX-H Series Desktop PC NX1- H700/H800/H900 NX2- H700/H800/H900 NX1-H Series 사양 Series 제품설명 ( 모델명 ) NX1-H Series, 슬림타입 기본형모델중보급형모델고급형모델 NX1-H800:112SN NX1-H800:324SN NX1-H800:534MS
More information출원국 권 리 구 분 상 태 권리번호 KR 특허 등록 10-2012-0092520 10-2012-0092518 10-2007-0071793 10-2012-0092517
기술사업성평가서 경쟁정보분석서비스 제공 기술 2014 8 출원국 권 리 구 분 상 태 권리번호 KR 특허 등록 10-2012-0092520 10-2012-0092518 10-2007-0071793 10-2012-0092517 Ⅰ 기술 구현 메커니즘 - 1 - 경쟁정보분석서비스 항목 - 2 - 핵심 기술 특징 및 주요 도면
More information5 주차 -mongodb 설치잠깐! CAP 이론 NoSQL이나온이유와 MongoDB NoSQL의데이터저장구조에따른세가지분류 RDBMS와 NoSQL특성비교 RDBMS와 NoSQL의사용시기 MongoDB 소개및특징 MongoDB와 RDBMS와의공통 MongoDB CRUD
5 주차 -mongodb 설치잠깐! CAP 이론 NoSQL이나온이유와 MongoDB NoSQL의데이터저장구조에따른세가지분류 RDBMS와 NoSQL특성비교 RDBMS와 NoSQL의사용시기 MongoDB 소개및특징 MongoDB와 RDBMS와의공통 MongoDB CRUD Data Modeling 참고 MongoDB CRUD Operations MongoDB 실습설치환경구동확인
More informationContents Test Lab 홖경... 3 Windows 2008 R2 서버를도메인멤버서버로추가... 4 기존 Windows 2003 AD 홖경에서 Windows 2008 R2 AD 홖경으로업그레이드를위한사젂작업 7 기존 Windows 2003 AD의스키마확장...
Active Directory Upgrade from W2K3 to W2K8 R2 5/10/2010 Microsoft Dong Chul Lee Contents Test Lab 홖경... 3 Windows 2008 R2 서버를도메인멤버서버로추가... 4 기존 Windows 2003 AD 홖경에서 Windows 2008 R2 AD 홖경으로업그레이드를위한사젂작업
More informationMicrosoft PowerPoint - 알고리즘_1주차_2차시.pptx
Chapter 2 Secondary Storage and System Software References: 1. M. J. Folk and B. Zoellick, File Structures, Addison-Wesley. 목차 Disks Storage as a Hierarchy Buffer Management Flash Memory 영남대학교데이터베이스연구실
More informationSECTION TITLE A PURE PRIMER (AI), // 1
SECTION TITLE A PURE PRIMER (AI), // 1 ,...,.,,. AI Enlitic.. Aipoly Microsoft Seeing AI.,, " ",. 4. 4..,.,?.. AI Drive.ai Lyft. // 1 .,.. 1. 2. 3.,. 50~100,., (AI) 4.,,.,.. // 2 ,,. 1 (HAL VARIAN) //,
More informationI I-1 I-2 I-3 I-4 I-5 I-6 GIS II II-1 II-2 II-3 III III-1 III-2 III-3 III-4 III-5 III-6 IV GIS IV-1 IV-2 (Complement) IV-3 IV-4 V References * 2012.
: 2013 1 25 Homepage: www.gaia3d.com Contact: info@gaia3d.com I I-1 I-2 I-3 I-4 I-5 I-6 GIS II II-1 II-2 II-3 III III-1 III-2 III-3 III-4 III-5 III-6 IV GIS IV-1 IV-2 (Complement) IV-3 IV-4 V References
More informationMS-SQL SERVER 대비 기능
Business! ORACLE MS - SQL ORACLE MS - SQL Clustering A-Z A-F G-L M-R S-Z T-Z Microsoft EE : Works for benchmarks only CREATE VIEW Customers AS SELECT * FROM Server1.TableOwner.Customers_33 UNION ALL SELECT
More information자동화된 소프트웨어 정의 데이터센터
엔터프라이즈데이터레이크와 Scale-Out 데이터스토리지 서영일차장한국이엠씨컴퓨터시스템즈 1 목차 Data Lake 전략의필요성 Enterprise Data Lake 정의 EMC의 EDLP(Enterprise Data Lake Platform) 전략 EMC Scale-Out NAS Isilon 성공사례 2 전통적인분석을위한 Data Flow 전통적인분석방식의한계점
More informationOracle9i Real Application Clusters
Senior Sales Consultant Oracle Corporation Oracle9i Real Application Clusters Agenda? ? (interconnect) (clusterware) Oracle9i Real Application Clusters computing is a breakthrough technology. The ability
More information공개 SW 기술지원센터
- 1 - 일자 VERSION 변경내역작성자 2007. 11. 20 0.1 초기작성손명선 - 2 - 1. 문서개요 4 가. 문서의목적 4 나. 본문서의사용방법 4 2. 테스트완료사항 5 가. 성능테스트결과 5 나. Tomcat + 단일노드 MySQL 성능테스트상세결과 5 다. Tomcat + MySQL Cluster 성능테스트상세결과 10 3. 테스트환경 15
More informationPowerPoint Presentation
FORENSICINSIGHT SEMINAR SQLite Recovery zurum herosdfrc@google.co.kr Contents 1. SQLite! 2. SQLite 구조 3. 레코드의삭제 4. 삭제된영역추적 5. 레코드복원기법 forensicinsight.org Page 2 / 22 SQLite! - What is.. - and why? forensicinsight.org
More informationWindows Server 2012
Windows Server 2012 Shared Nothing Live Migration Shared Nothing Live Migration 은 SMB Live Migration 방식과다른점은 VM 데이터파일의위치입니다. Shared Nothing Live Migration 방식은 Hyper-V 호스트의로컬디스크에 VM 데이터파일이위치합니다. 반면에, SMB
More information[Brochure] KOR_TunA
LG CNS LG CNS APM (TunA) LG CNS APM (TunA) 어플리케이션의 성능 개선을 위한 직관적이고 심플한 APM 솔루션 APM 이란? Application Performance Management 란? 사용자 관점 그리고 비즈니스 관점에서 실제 서비스되고 있는 어플리케이션의 성능 관리 체계입니다. 이를 위해서는 신속한 장애 지점 파악 /
More informationCONTENTS CONTENTS CONTENT 1. SSD & HDD 비교 2. SSD 서버 & HDD 서버 비교 3. LSD SSD 서버 & HDD 서버 비교 4. LSD SSD 서버 & 글로벌 SSD 서버 비교 2
읽기속도 1초에 20Gbps www.lsdtech.co.kr 2011. 7. 01 Green Computing SSD Server & SSD Storage 이기택 82-10-8724-0575 ktlee1217@lsdtech.co.kr CONTENTS CONTENTS CONTENT 1. SSD & HDD 비교 2. SSD 서버 & HDD 서버 비교 3. LSD
More informationE-BI Day Presentation
E-Business Intelligence Agenda Issue E-BI Architecture ORACLE E-BI Solutions ORACLE E-BI ORACLE E-BI I. Issue? KPI. (KPI ). Jeff Henley, CFO, Oracle Corporation I. Issue? I. Issue Many Sources, Users,and
More informationlecture01
Lecture 01: Database Overview Kwang-Man Ko kkmam@sangji.ac.kr, compiler.sangji.ac.kr Department of Computer Engineering Sang Ji University 2018 강의정보 l 교과목명 : 데이터베이스 l 선수과목 : 자료구조, 화일구조 l 강의시간 : 금 3,4,5교시
More information쉽게 풀어쓴 C 프로그래밊
Power Java 제 27 장데이터베이스 프로그래밍 이번장에서학습할내용 자바와데이터베이스 데이터베이스의기초 SQL JDBC 를이용한프로그래밍 변경가능한결과집합 자바를통하여데이터베이스를사용하는방법을학습합니다. 자바와데이터베이스 JDBC(Java Database Connectivity) 는자바 API 의하나로서데이터베이스에연결하여서데이터베이스안의데이터에대하여검색하고데이터를변경할수있게한다.
More informationREDIS 이해와 활용
Redis 활용방안에따른아키텍처 LG CNS 아키텍처컨설팅팀조남웅과장 I. Why Redis? II. Redis 활용방안에따른아키텍처 1.1 NoSQL 관점에서의 Redis Ⅰ. WHY Redis? 1.1.1 NoSQL DBMS 의특징 NoSQL 의대표적인 Data Model 은아래와같으며, 복잡도가증가할수록성능은저하됨 Data Model Data Model
More informationMicrosoft PowerPoint - ch09 - 연결형리스트, Stack, Queue와 응용 pm0100
2015-1 프로그래밍언어 9. 연결형리스트, Stack, Queue 2015 년 5 월 4 일 교수김영탁 영남대학교공과대학정보통신공학과 (Tel : +82-53-810-2497; Fax : +82-53-810-4742 http://antl.yu.ac.kr/; E-mail : ytkim@yu.ac.kr) 연결리스트 (Linked List) 연결리스트연산 Stack
More information슬라이드 1
마이크로컨트롤러 2 (MicroController2) 2 강 ATmega128 의 external interrupt 이귀형교수님 학습목표 interrupt 란무엇인가? 기본개념을알아본다. interrupt 중에서가장사용하기쉬운 external interrupt 의사용방법을학습한다. 1. Interrupt 는왜필요할까? 함수동작을추가하여실행시키려면? //***
More information2017 1
2017 2017 Data Industry White Paper 2017 1 4 1 2 3 4 5 6 7 8 9 10 Interview 1 DBMS 4 DBMS * 128 2017 DBMS Database Management System DB DBMS DBMS NoSQL Non-Structured Query Language DBMS NoSQL 4 4 Relational,
More informationYggdrash White Paper Kr_ver 0.18
White paper (ver 0.18) 1 ,.,.?.,,,???..,,..,.,...,.,., p2p.. Team Yggdrash 2 1. 1.1 Why, Another, Blockchain? (,,?) 1.1.1, (TPS) / (Throughput),?. DApp., DB P2P..,.. DApp.... 2012 2 2018 2, 150GB, 14..
More informationMicrosoft Word - PLC제어응용-2차시.doc
과정명 PLC 제어응용차시명 2 차시. 접점명령 학습목표 1. 연산개시명령 (LOAD, LOAD NOT) 에대하여설명할수있다. 2. 직렬접속명령 (AND, AND NOT) 에대하여설명할수있다. 3. 병렬접속명령 (OR, OR NOT) 에대하여설명할수있다. 4.PLC의접점명령을가지고간단한프로그램을작성할수있다. 학습내용 1. 연산개시명령 1) 연산개시명령 (LOAD,
More information리포트_03.PDF
working paper no 3 e-bizgroup working paper no 3 (Enterprise Portal)Yahoo Web Portal (document), (application component) (gateway),, (unified interface) (Web Infrastructure) B2C, B2B, B2E Merrill Lynch
More informationMicrosoft PowerPoint - 27.pptx
이산수학 () n-항관계 (n-ary Relations) 2011년봄학기 강원대학교컴퓨터과학전공문양세 n-ary Relations (n-항관계 ) An n-ary relation R on sets A 1,,A n, written R:A 1,,A n, is a subset R A 1 A n. (A 1,,A n 에대한 n- 항관계 R 은 A 1 A n 의부분집합이다.)
More information<C0CCBCBCBFB52DC1A4B4EBBFF82DBCAEBBE7B3EDB9AE2D313939392D382E687770>
i ii iii iv v vi 1 2 3 4 가상대학 시스템의 국내외 현황 조사 가상대학 플랫폼 개발 이상적인 가상대학시스템의 미래상 제안 5 웹-기반 가상대학 시스템 전통적인 교수 방법 시간/공간 제약을 극복한 학습동기 부여 교수의 일방적인 내용전달 교수와 학생간의 상호작용 동료 학생들 간의 상호작용 가상대학 운영 공지사항,강의록 자료실, 메모 질의응답,
More informationPowerPoint Presentation
FORENSIC INSIGHT; DIGITAL FORENSICS COMMUNITY IN KOREA SQL Server Forensic AhnLab A-FIRST Rea10ne unused6@gmail.com Choi Jinwon Contents 1. SQL Server Forensic 2. SQL Server Artifacts 3. Database Files
More informationIBM Business Intelligence Solution Seminar 2005 Choose the Right Data Integration Solution ; Best Practices on EII/EAI/ETL IBM DB2 Technical Sales BI
Choose the Right Data Integration Solution ; Best Practices on EII/EAI/ETL IBM DB2 Technical Sales BI Team (byrhee@kr.ibm.com) 2005 IBM Corporation Agenda I. II. ETL, EII, EAI III. ETL, EII, EAI Best Practice
More information빅데이터분산컴퓨팅-5-수정
Apache Hive 빅데이터분산컴퓨팅 박영택 Apache Hive 개요 Apache Hive 는 MapReduce 기반의 High-level abstraction HiveQL은 SQL-like 언어를사용 Hadoop 클러스터에서 MapReduce 잡을생성함 Facebook 에서데이터웨어하우스를위해개발되었음 현재는오픈소스인 Apache 프로젝트 Hive 유저를위한
More information위세아이텍_iOLAP_
빅데이터관리와분석을위한 플랫폼융합활용사례 BI Forum 분석시스템구축 Review(1/2) 1 분석시스템구축 Review(2/2) 분석속도가느리다면? 정보요구사항이변하거나 추가된다면? 데이터량이너무많다면? 2 과거의빅데이터저장 데이터량이너무많다 그러나 RDBMS 에서관리하는것은 막대한비용소요 지금까지의처리방안 1. 데이터간에우선순위부여 신용카드데이터 > 상품데이터
More information소프트웨어공학 Tutorial #2: StarUML Eun Man Choi
소프트웨어공학 Tutorial #2: StarUML Eun Man Choi emchoi@dgu.ac.kr Contents l StarUML 개요 l StarUML 소개및특징 l 주요기능 l StarUML 화면소개 l StarUML 설치 l StarUML 다운 & 설치하기 l 연습 l 사용사례다이어그램그리기 l 클래스다이어그램그리기 l 순서다이어그램그리기 2
More information<4D6963726F736F667420576F7264202D205B4354BDC9C3FEB8AEC6F7C6AE5D3131C8A35FC5ACB6F3BFECB5E520C4C4C7BBC6C320B1E2BCFA20B5BFC7E2>
목차(Table of Content) 1. 클라우드 컴퓨팅 서비스 개요... 2 1.1 클라우드 컴퓨팅의 정의... 2 1.2 미래 핵심 IT 서비스로 주목받는 클라우드 컴퓨팅... 3 (1) 기업 내 협업 환경 구축 및 비용 절감 기대... 3 (2) N-스크린 구현에 따른 클라우드 컴퓨팅 기술 기대 증폭... 4 1.3 퍼스널 클라우드와 미디어 콘텐츠 서비스의
More informationMicrosoft PowerPoint - chap01-C언어개요.pptx
#include int main(void) { int num; printf( Please enter an integer: "); scanf("%d", &num); if ( num < 0 ) printf("is negative.\n"); printf("num = %d\n", num); return 0; } 1 학습목표 프로그래밍의 기본 개념을
More informationPowerPoint 프레젠테이션
ㆍ Natural Language Understanding 관련기술 ㆍ Semantic Parsing Conversational AI Natural Language Understanding / Machine Learning ㆍEntity Extraction and Resolution - Machine Learning 관련기술연구개발경험보유자ㆍStatistical
More informationJVM 메모리구조
조명이정도면괜찮조! 주제 JVM 메모리구조 설미라자료조사, 자료작성, PPT 작성, 보고서작성. 발표. 조장. 최지성자료조사, 자료작성, PPT 작성, 보고서작성. 발표. 조원 이용열자료조사, 자료작성, PPT 작성, 보고서작성. 이윤경 자료조사, 자료작성, PPT작성, 보고서작성. 이수은 자료조사, 자료작성, PPT작성, 보고서작성. 발표일 2013. 05.
More information