슬라이드 1

Similar documents
슬라이드 1

°¡°Ç2¿ù-ÃÖÁ¾

APOGEE Insight_KR_Base_3P11

NoSQL

Cloud Friendly System Architecture

IPAK 윤리강령 나는 _ 한국IT전문가협회 회원으로서 긍지와 보람을 느끼며 정보시스템 활용하 자. 나는 _동료, 단체 및 국가 나아가 인류사회에 대하여 철저한 책임 의식을 가진 다. 나는 _ 활용자에 대하여 그 편익을 증진시키는데 최선을 다한다. 나는 _ 동료에 대해

초보자를 위한 분산 캐시 활용 전략

Windows 8에서 BioStar 1 설치하기

1217 WebTrafMon II

특허청구의 범위 청구항 1 게임 서버 또는 미들웨어에 의해, 사용자 단말기로부터, GPS 정보, IP 정보, 중계기 정보 중 적어도 하나를 이 용한 위치 정보와, 상기 사용자 단말기에 설정된 언어 종류를 포함하는 사용자 정보를 수신하는 단계; 상기 게임 서버 또는 미들

PowerPoint 프레젠테이션

<4D F736F F D205B4354BDC9C3FEB8AEC6F7C6AE5D3131C8A35FC5ACB6F3BFECB5E520C4C4C7BBC6C320B1E2BCFA20B5BFC7E2>

PCServerMgmt7

11¿ù ½ÃÁ¶ ³»Áö

10¿ù ½ÃÁ¶ -Àü»ê

AGENDA 모바일 산업의 환경변화 모바일 클라우드 서비스의 등장 모바일 클라우드 서비스 융합사례

MongoDB Trends and Introduction 우정웅연구원 Dec. 02, 2014

품질검증분야 Stack 통합 Test 결과보고서 [ The Bug Genie ]

Intra_DW_Ch4.PDF

김기남_ATDC2016_160620_[키노트].key

플랫폼을말하다 2

PowerPoint 프레젠테이션

SQL Developer Connect to TimesTen 유니원아이앤씨 DB 기술지원팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 작성자

Open Cloud Engine Open Source Big Data Platform Flamingo Project Open Cloud Engine Flamingo Project Leader 김병곤

歯Phone

목차 BUG offline replicator 에서유효하지않은로그를읽을경우비정상종료할수있다... 3 BUG 각 partition 이서로다른 tablespace 를가지고, column type 이 CLOB 이며, 해당 table 을 truncate

Spring Boot/JDBC JdbcTemplate/CRUD 예제

Ç¥Áö

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

PowerPoint 프레젠테이션

untitled

CONTENTS Volume 테마 즐겨찾기 빅데이터의 현주소 진일보하는 공개 기술, 빅데이터 새 시대를 열다 12 테마 활동 빅데이터 플랫폼 기술의 현황 빅데이터, 하둡 품고 병렬처리 가속화 16 테마 더하기 국내 빅데이터 산 학 연 관

スライド タイトルなし

<31325FB1E8B0E6BCBA2E687770>


Microsoft Word - 조병호

Cover Story Oracle Big Data Vision 01_Big Data의 배경 02_Big Data의 정의 03_Big Data의 활용 방안 04_Big Data의 가치

Web Application Hosting in the AWS Cloud Contents 개요 가용성과 확장성이 높은 웹 호스팅은 복잡하고 비용이 많이 드는 사업이 될 수 있습니다. 전통적인 웹 확장 아키텍처는 높은 수준의 안정성을 보장하기 위해 복잡한 솔루션으로 구현

MySQL-Ch05

LXR 설치 및 사용법.doc

제 31회 전국 고교생 문예백일장 산문 부문 심사평.hwp

°¡°Ç6¿ù³»ÁöÃÖÁ¾

기술 이력서 2.0

Data Industry White Paper

디지털포렌식학회 논문양식

3. 클라우드 컴퓨팅 상호 운용성 기반의 서비스 평가 방법론 개발.hwp

대표이사등의확인서명( ) I. 회사의 개요 1. 회사의 개요 1. 연결대상 종속회사 개황(연결재무제표를 작성하는 주권상장법인이 사업보고서, 분기ㆍ 반기보고서를 제출하는 경우에 한함) (단위 : 백만원) 상호 설립일 주소 주요사업 직전사업연도말 자산총액 지배

最即時的Sybase ASE Server資料庫診斷工具

2/21

untitled

5¿ù½ÃÁ¶Àü»ê

1차내지

170

006- 5¿ùc03ÖÁ¾T300çÃâ

I I-1 I-2 I-3 I-4 I-5 I-6 GIS II II-1 II-2 II-3 III III-1 III-2 III-3 III-4 III-5 III-6 IV GIS IV-1 IV-2 (Complement) IV-3 IV-4 V References * 2012.

Intro to Servlet, EJB, JSP, WS

텀블러514

s SINUMERIK 840C Service and User Manual DATA SAVING & LOADING & & /

<4D F736F F D205B4354BDC9C3FEB8AEC6F7C6AE5D39C8A35F B3E C0AFB8C1B1E2BCFA20B5BFC7E2>

e-spider_제품표준제안서_160516

Solaris Express Developer Edition

비식별화 기술 활용 안내서-최종수정.indd

Windows 10 General Announcement v1.0-KO

0125_ 워크샵 발표자료_완성.key

Eclipse 와 Firefox 를이용한 Javascript 개발 발표자 : 문경대 11 년 10 월 26 일수요일


Microsoft Word - ntasFrameBuilderInstallGuide2.5.doc

치 78%로 가장 많았으며, A/S 57.1%, 영업 48.4%, 철거 18.1%, 공사 2.7%, LGT 업무 0.5%로 나타났다. 두 사업장에서 대부분 설치와 A/S는 같이 하는 경우 가 많았으며, 의 경우 영업을 같이 하는 경우도 높았다. 두 통신업체 산하의 협력

chapter4

Cover Story 시간은 하루 24시간이지만 시간의 질, 그리고 체감되는 양은 사람마다 다를 것입니다. 시간에 쫓기면서 살아서는 안되겠죠. 하지만 시간을 능동적으로 운용하는 현명함, 정말 필요한 때입니다. 2013년 첫 번째로 선보이는 사보에서는 Time 을 주제로

단계

<B1DDC0B6C1A4BAB8C8ADC1D6BFE4B5BFC7E228C1A63836C8A3292E687770>


Microsoft PowerPoint 자동설치시스템검증-V05-Baul.pptx

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

Microsoft Word - Automap3

I What is Syrup Store? 1. Syrup Store 2. Syrup Store Component 3.

Microsoft PowerPoint - 10Àå.ppt

YUM(Yellowdog Updater,Modified) : RPM 패키지가저장된서버 ( 저장소 ) 로부터원하는패키지를자동으로설치한다. : YUM 도구는 RPM 의패키지의존성문제를해결

untitled

Chapter 1

Raspbian 설치 라즈비안 OS (Raspbian OS) 라즈베리파이 3 Model B USB 마우스 USB 키보드 마이크로 SD 카드 마이크로 SD 카드리더기 HDM I 케이블모니터

슬라이드 1

출원국 권 리 구 분 상 태 권리번호 KR 특허 등록

PowerPoint 프레젠테이션

歯이혜경.PDF


SECTION TITLE A PURE PRIMER (AI), // 1

1

OVERVIEW 디트라이브는 커뮤니케이션 환경의 다변화에 대응하기 위한 고객들의 다양한 욕구를 충족시키기 위해, TV광고부터 온라인 광고 및 프로모션과 웹사이트 구축은 물론 뉴미디어까지 아우르는 다양한 IMC 기능을 수행하는 마케팅 커뮤니케이션 회사입니다. 대표이사 설

ecorp-프로젝트제안서작성실무(양식3)

¿ÀǼҽº°¡À̵å1 -new

Microsoft PowerPoint - CNVZNGWAIYSE.pptx

2

<5B4E DBDBAB8B6C6AEC4DCC5D9C3F720BFF9B0A3B5BFC7E2BAB8B0ED5F35C8A32838BFF9292E687770>

통합관리솔루션(Zabbix) 2.4 소개

PowerPoint Presentation

°ø°³¼ÒÇÁÆ®-8È£

ÃÖÁ¾-ÆíÁý

DW 개요.PDF

Transcription:

R User Conference Korea 2015 Using R with MongoDB 김인범 SK C&C

Tables 1. MongoDB? 2. Rmong & RMOngodb 3. Why R + MongoDB 4.Tips for R + MongoDB

I am... 김인범 (SK C&C) Cloud Computing Infra Service Team 1 MongoDB Korea, R Korea

Table 1. MongoDB...?

MongoDB 첫질문? Mongol 사람들이만들었나요? MongoDB 만든곳의대주주가 Mongol 사람...? 알고보니 MongoDB 만든사람이 Mongol 후손...?

What is MongoDB? humongous = 거대한 humongousdb

What is MongoDB? Document Oriented Database Replication / Sharding Multiple Transaction(CRUD) Map-Reduce also possible Latest Stable Version is 3.0.3(May 2015, bug hunting)

Question?

Answer!

Growing Up!

MongoDB 구조간단 review -1 Mongo 샤딩은 Data collection 에대해 unlimited size 를제공 (big data 를다루는데있어매우중요 )

MongoDB 구조간단 review - 2 mongod - 데이터를저장, 관리하는서버 ( 복제정책적용가능 ) mongos - client 의요청받아환경설정서버의 partitioning 정보를참고해적절한데이터서버로요청을포워딩 Config Server - sharding 에대한환경설정서버 - partitioning 에대한정보를관리

MongoDB Benefit Elements of MongoDB fit for Cloud Environment Open Source Easy Scalability(Scale out), Easy Install, Easy Use Scheme-less High Availability

MongoDB use ( 해외 ) facebook, google, twitter MetLife, foursquare, NewYork Times, Forbes 이외에도 http://www.mongodb.com/who-uses-mongodb

해외사례요약하자면...

MongoDB use ( 국내 ) FIFA Online 2 DaumKakao My Agora LG U+ 그룹웨어, 패턴분석처리시스템 인터파크, 상품검색및채팅서비스시스템

MongoDB use ( 국내 )

시간이없어서나머지는다음기회에

직접해보시려면...

직접해보시려면 MongoDB Download link

귀찮으시죠..?

귀찮으시죠..? MongoDB Shell link http://try.mongodb.org/?_ga=1.232175391.1478816937.1399257850

귀찮으시죠..?

귀찮으시죠..?

이런ㅆ...

직접공부해보려면...

공부해보려면 MongoDB education link https://university.mongodb.com/

공부할수있는것들... MongoDB education link https://university.mongodb.com/

공부하다얻을수있는것...?

MongoDB 이럴때쓰지마세요! 고객이 Oracle이랑비교할때 (RDBMS와는태생이다름 ) 무료라는이야기듣고고객이들이댈때 재정적으로여유가있을때 License에대한이해가불충분한경우

고객이말합니다 (feat. 불특정다수의갑님 ) 오픈소스인데추가비용이왜필요하죠? 라이선스...? 뭐래.. 아니왜오라클보다성능이안나오는것같죠? 오라클은어쩌구, MySQL은저쩌구, 나는왕년에 #$1!@$#$..

MongoDB 이럴때쓰세요! 유연함과확장이필요할때 log data, SNS data 등을적재할때 다양한 open source와연계할때 (ex. Hadoop) 서비스구성시다양한시도가필요할때 고객이 open source에대한이해가충분할때

Table 2. Rmongo & rmongodb

Rmongo Package MongoDB interface for R 인터페이스는 mongo-java-driver로의 java call을통해제공됨. 0.0.25, GPL-3 R( >= 2.14.1), Java( >= 1.6), MongoDB( >= 1.6)

Rmongo : Advantage Rmongo 는매우직관적인스타일의패키지 그렇기때문에이해하기쉽고, 사용하기쉬움 ( 상대적으로 )

Rmongo : Dis-advantage 성능상의아쉬움 인터페이스가 mongo-java-driver 이기때문에 java 에대한두려움이있는이들에게는장벽으로다가올수있음 ( 단순사용이아닌패키지구조확인및 customizing 에있어서..)

rmongodb Package MongoDB interface for R 인터페이스는 mongo-c-driver(ver 0.8) 를이용하여제공됨 1.8.0, Apache License R( >= 2.10), MongoDB, GNU Make

rmongodb : Advantage MongoDB 의대부분의기능을반영함 (Rmongo 와대조됨 ) Good Performance

rmongodb Dis-Advantage MongoDB 3.0 이상에서부터는인증이슈존재 패키지유지문제와신규기능에대한릴리즈의어려움 Mongo-C-Driver 1.0+ 은완전히다른 API 가짐 즉 0.8 에서 1.0 으로업그레이드하려면거의처음부터모든패키지를다시써야함

RMongo workflow mongo <- mongodbconnect("test", "localhost", 27017) output <- dbinsertdocument(mongo, "test_data", '{"foo": "bar"}') output <- dbgetquery(mongo, "test_data", '{"foo": "bar"}') dbdisconnect(mongo)

rmongodb workflow mongo <- mongo.create(host="localhost,db= test ) mongo.get.databases(mongo) ns= test.test_data buf=mongo.bson.buffer.create() Mongo.bson.buffer.append(buf, foo, bar ) a=mongo.bson.from.buffer(buf) Mongo.insert(mongo,ns,a) mongo.find.all(mongo,ns) (or mongo.find.one(mongo, test.test_data, a) ) mongo.disconnect (mongo)

Table 3. Why R + MongoDB

R + MongoDB 의매력 (1) 꾸준히발전하는 OpenSource (release 주기가안정적 ) 명확한역할구분 (r visualization, mongodb backend 저장소 )

R + MongoDB 의매력 (2) 대규모의데이터를다루는 R 에게 NoSQL 은 매력적인선택 명확한역할구분 (r visualization, mongodb backend 저장소 )

R + MongoDB 의매력 (3) 이미많은 Relational SQL 패키지가존재. (RMySQL, RPostgreSQL, Roracle, RJDBC 등 ) 하지만이들의문제는모든결과를 R 메모리상에서 read 한다는것!

R + MongoDB 의매력 (4) Rmongo 역시같은문제, 하지만 rmongodb 는그러한문제에서자유로움 위와더불어 MongoDB 가 bulk insert 에서 탁월한성능을보임.

Table 4. Tips for R + MongoDB

Tips 1. mongodb 설치서버와 R 설치서버는구분하는것이좋다.

Tips 2. 예산의문제가있다면 config 서버에설치하는것도좋다.

Tips 3. CPU 는무조건 64bit~! 메모리는 Maximum 구성 ~!

Tips 4. 굳이 MongoDB 일필요는없다. 특징과목적에맞는구분이필요하다.

Tips 5. MongoDB 는 scheme 에서 free... 하지만!!! 특정주제에맞춰분석을하려면 스키마에대한정의와제한은필요하다.

Tips 6. MongoDB의 release에따른 R의 version 관리가필요함. deprecated 된함수들이종종발생할수있으며, 호환성문제도발생가능

Tips 7. MongoDB상에 concurrent하게데이터를 read/write 하고싶다면... mongodb.splitvector() 를써서 chunk 단위로 collection을분리하고각 chunk 상에 mclapply() 적용

맺음말 물론여전히분석에 focusing 을맞춰야하지만..

맺음말 MongoDB 를비롯한 NOSQL 등은 확장성과유연성을제공할수있는기반.

맺음말 축구는골을넣어야이기는경기지만, 수비가잘되면우승까지노릴수있습니다.

맺음말 NoSQL 활용을통해 R 을사용할수있다면, 여러분은든든한리베로를얻을수있을것입니다.

맺음말 그리고그리베로는여러분을좀더 높은단계로이끌어줄것입니다.

감사합니다! inbum85@gmail.com Special Thanks to Mr. Selivanov