Microsoft Professional Program Data Science 과정소개서
Microsoft Professional Program Data Science MPP 란무엇인가요? 4 차산업혁명시대의기업과기관에서필요로하는가장최신직무의수행에도움이되는핵심기술을가르치는코스의모음입니다. 각코스는동영상강의와퀴즈, 클라우드기반의실습랩을포함하고있어매우재미있게학습할수있는온라인강좌입니다. 또한각코스를우수한성적으로마쳤을경우이를입증할수있는마이크로소프트공식인증서를획득할수있어취업 / 재취업 / 창업에큰도움이될수있습니다. Microsoft wants to empower every student today to succeed in tomorrow s job market, regardless of socio-economic status or ability. Microsoft Satya Nadella Microsoft 는오늘날의모든학생들이사회경제적지위 또는능력에관계없이내일의직업시장에서성공할수 있도록힘을북돋고싶습니다. 왜마이크로소프트데이터사이언스과정을학습해야하나요? 최근전세계적으로가장인기있는직업분야인데이터사이언티스트에도전해보십시오. Microsoft 에서만든독창적인 MPP 온라인학습프로그램은산업계의데이터사이언티스트및학계전문가가제공하는데이터사이언스의기초, 주요데이터사이언스기술및광범위하게사용되는프로그래밍언어를교육커리큘럼으로제공하고있습니다. 데이터사이언티스트를필요로하는산업계의요구를반영하여산학공동으로구축된 Microsoft 전문프로그램인데이터사이언스과정은현재전세계적으로데이터사이언스분야에서제공되는 150 만건의취업기회를활용하는데필요한직무기술및프로그래밍기술을제공합니다.
과정을통해학습할수있는기술 Use Microsoft Excel to explore data Use Transact-SQL to query a relational database Create data models and visualize data using Excel or Power BI Apply statistical methods to data Use R or Python to explore and transform data Follow a data science methodology Create and validate machine learning models with Azure Machine Learning Write R or Python code to build machine learning models Apply data science techniques to common scenarios Implement a machine learning solution for a given data problem 학습방법안내 마이크로소프트에서개발한데이터사이언스교육과정은총 9 개의 Track 으로운영되고있으며각각의순서대로학습을진행하는것을제안하지만, 본인의관심도와학습경험에따라자유롭게과정을선택하여학습할수도있습니다. 또한온라인학습은자기주도적으로이루어지지만교육기관에서제공하는 Guide 에따라학습계획을세울수도있습니다. MS Certification 인증서취득 전체 9 개 Track 13 과목으로진행되는 Data Science 과정은학습자가목표로하는진로와경력에맞추어학습을완료한이후인증서를취득할수있습니다. 우수한성적으로학습을완료하면 academy.microsoft.com 과연동되어학습자의학습정보를관리하고, 추후전세계적으로채용에활용되고있는 LinkIn 과연동을통해개개인의커리어를취업과연동할수도있습니다. [ 선문대학교글로벌소프트웨어학과데이터사이언스학습동아리 ]
Data Science Professional Program 과정개요 Unit 1 기본과정 데이터사이언스에대한기초과정입니다. 데이터쿼리, 데이터분석, 데이터시각화및통계데이터를 활용하는데이터과학의기본과정을학습할수있습니다. Course 3a 와 Course 3b 는선택하여 과정을학습하면됩니다. Course 1: Data Science Orientation Course 2: Querying Data with Transact-SQL Course 3a: Analyzing and Visualizing Data with Excel Course 3b: Analyzing and Visualizing Data with Power BI Course 4: Essential Statistics for Data Analysis using Excel Unit 2 데이터사이언스의핵심 머신러닝을활용하여데이터를분석하기위한기초적인프로그래밍언어를학습할수있습니다.. Course 5a 와 Course 5b 는선택하여과정을학습하면됩니다. Course 5a: Introduction to R for Data Science Course 5b: Introduction to Python for Data Science Course 6: Data Science Essentials Course 7: Principles of Machine Learning Unit 3 데이터사이언스의응용 데이터분석을위한좀더깊이있는프로그래밍언어를학습하며, 데이터를활용하여지능형솔루션을개발하는방법을배울수있습니다. Course 8a 와 Course 8b 는선택하여학습할수있고 Unit 2 에서선택한프로그래밍언어를지속하는것이좋습니다. Course 9a 와 9b 역시선택하여학습을진행합니다. Course 8a: Programming with R for Data Science Course 8b: Programming with Python for Data Science Course 9a: Implementing Predictive Analytics with Spark in Azure HDInsight Course 9b: Analyzing Big Data with Microsoft R
Unit 1 기본과정 Course 1 : Data Science Orientation 예상학습기간 : 6 주 1 주일에 2~4 시간학습권고주관기관 : Microsoft 주제 : Computer Science 레벨 : 입문동영상강의 : 한글 / 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 과정에포함되어있습니다. 데이터사이언티스트가되기위해무엇을준비해야할까요? 이과정은마이크로소프트데이터사이언스과정의첫번째시작점입니다. 데이터사이언스 오리엔테이션을통해프로그램을시작하고, 전체학습일정을계획할수있습니다. 정해진학습목표에 따라다양한시각화방법, 분석및통계기법을사용하여데이터를다루는방법에대해소개합니다. 무엇을배우나요? How the Microsoft Data Science curriculum works How to navigate the curriculum and plan your course schedule Basic data exploration and visualization techniques in Microsoft Excel Foundational statistics that can be used to analyze data 강사소개 Graeme Malcolm Liberty J. Munson Senior Content Developer Microsoft Learning Experiences Principal Psychometrician and Quality Lead Microsoft
Course 2 : Querying Data with Transact-SQL 예상학습기간 : 6 주 1 주일에 4~5 시간학습권고주관기관 : Microsoft 주제 : Computer Science 레벨 : 중급동영상강의 : 한글 / 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 및 Big Data 과정에포함되어 있습니다. 트랜잭트 SQL 은데이터베이스로작업을하는데이터전문가및개발자에게필수적인기술입니다. 전문가의동영상강의, DEMO, 실습을통해가장처음 SELECT 구문에서부터트랜잭션방식의다양한논리구현을학습합니다. 여러개의코스모듈을학습하며 Microsoft SQL Server 또는 Azure SQL Database 의데이터쿼리및업데이트등트랜잭트 SQL 의주요영역을경험할수있습니다. 특히이과정은실습환경을제공하고있으며 Azure Cloud 기반의데이터베이스를쉽게배포할수있는샘플데이터베이스를사용하므로 SQL 을설치및구성하지않아도트랜잭트 SQL 을학습할수있습니다. 선행학습 데이터베이스및 IT 시스템에대한기본적인이해 무엇을배우나요? Create Transact-SQL SELECT queries Work with subqueries and APPLY Work with data types and NULL Use table expressions Query multiple tables with JOIN Group sets and pivot data Explore set operators Modify data Use functions and aggregate data Program with Transact-SQL Implement error handling and transactions 강사소개 Geoff Allix Graeme Malcolm Microsoft Certified IT Senior Content Developer Professional for SQL Server Microsoft Learning Content Master Experiences
Course 3a : Analyzing and Visualizing Data with Excel 예상학습기간 : 6 주 1 주일에 2~4 시간학습권고주관기관 : Microsoft 주제 : Business & Management 레벨 : 중급동영상강의 : 한글 / 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 및 Big Data 과정에포함되어 있습니다. 엑셀은데이터를분석하고시각화하는데가장널리사용되는솔루션중하나입니다. 향상된시각화기능과보다정교한비즈니스로직을반영하여더많은데이터를분석할수있는방법을학습하게됩니다. 이데이터사이언스과정에서는 Microsoft 의 Excel Product Team 전문가가 Excel 2016 에서의최신기능을소개합니다. 서로다른소스에서데이터를가져오는방법, 데이터원본간에매시업을만드는방법, 분석을위해데이터를준비하는방법에대해학습합니다. 데이터를준비한후 DAX 계산엔진을사용하여비즈니스결과를표현하는방법을알아보십시오. Power BI 클라우드서비스를활용하여데이터를시각화하고공유할수있는방법을확인한후, 대시보드에서사용하거나또는일반영어로된명령문을사용하여쿼리할수있으며, 모바일장치에서도사용할수있습니다. 선행학습 테이블, 피벗테이블및피벗차트와같은엑셀분석도구에대한이해또한 DB 의데이터및텍스트 파일작업에대한선행지식이도움이됩니다. (DAT205x: Introduction to Data Analysis using Excel) 강의계획서 1 주 Office 응용프로그램을설치하여실습환경을설정하십시오. 이미워크시트 / 그리드데이터에준비되어있는데이터에대해피벗테이블, 피벗차트및슬라이서와같은도구를사용하여엑셀에서데이터분석을수행하는방법을학습하십시오. Power Pivot 추가기능을사용하여엑셀데이터모델, 컨텐츠및구조를탐색하십시오. 또한컬럼의데이터를측정하기위한 DAX(Data Analysis Expressions) 에대해서배웁니다. 2 주 쿼리 (Excel 2013 및 Excel 2010 의 Power Query 추가기능 ) 에대해알아보고단일플랫테이블에서
엑셀데이터모델을작성하십시오. SQL 데이터베이스에서여러테이블을가져오는방법과가져온 데이터에서엑셀데이터모델을만드는방법에대해알아보십시오. 텍스트파일의데이터와 SQL 데이터베이스의데이터사이에매시업을만드는방법을학습합니다. 3 주각셀에대해계산할측정값을만드는방법, 계산을위해컨텍스트를필터링하는방법및여러가지고급 DAX 함수를탐색하는방법에대한세부내용을학습할수있습니다. 고급텍스트쿼리를사용하여서식이지정된엑셀보고서에서데이터를가져오는방법을배우십시오. 또한표준사용자인터페이스이상으로난이도가높은쿼리를배웁니다. 4 주 Excel 에서멋진시각화를만드는방법을살펴보십시오. 큐브함수를사용하여전년대비비교를수행하게됩니다. 타임라인, 계층구조및슬라이서를만들어시각화를보다향상시킵니다. 엑셀이 Power BI 와함께어떻게작동하는지알아볼수있습니다. 엑셀통합문서를 Power BI 서비스에업로드하는방법을배웁니다. 마지막으로모바일플랫폼에서엑셀사용법을살펴보게됩니다. 무엇을배우나요? Gather and transform data from Learn about data model creation multiple sources Explore, analyze, and visualize data Discover and combine data in mashups 강사소개 Dany Hoter Jonathan Sanito Solutions Architect DataRails Microsoft Senior Content Developer Microsoft
Course 3b : Analyzing and Visualizing Data with Power BI 예상학습기간 : 6 주 1 주일에 2~4 시간학습권고주관기관 : Microsoft 주제 : Computer Science 레벨 : 입문동영상강의 : 한글 / 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 및 Big Data 과정에포함되어 있습니다. 클라우드기반으로제공되는 Power BI 는기업내에서필요로하는데이터를직관적으로분석하고분석결과를시각화하여, 이를목적에맞게공유하는데큰인기를얻고있습니다. 이과정에서는 Microsoft 의 Power BI 제품팀에서직접개발한동영상강의와데모, 퀴즈및실습을통해학습을진행하게됩니다. Power BI 를통해데이터를연결하고가져오는방법부터 Power BI Desktop 을사용하여보고서를작성한다음 Power BI 클라우드서비스에게시할수있습니다. 또한웹및모바일장치에서사용자를위한대시보드를만들고공유하는방법을배울수있습니다. 선행학습 엑셀, 데이터베이스, 혹은텍스트기반의데이터작업경험 강의계획서 1 주 비즈니스인텔리전스, 데이터분석및데이터시각화의주요개념이해 Marketo, Salesforce 및 Google Analytics 와같은서비스에서데이터가져오기및대시보드자동생성 데이터연결및가져오기를수행한다음해당데이터를구성하고변환 비즈니스계산을통한데이터의가치증대 2 주 데이터시각화및보고서작성 업데이트일정에따라자동보고서새로고침 보고서및자연언어쿼리를기반으로대시보드만들기 조직전체에대시보드공유 모바일앱에서대시보드활용
3 주 Power BI 내에서엑셀보고서활용 대시보드및보고서에서사용할수있는사용자지정시각화만들기 보고서및대시보드작성을위해그룹내에서협업 조직의필요에따라대시보드를효과적으로공유 4 주 Power BI 를사용하여데이터에대한실시간연결탐색 SQL Azure, HD Spark 및 SQL Server Analysis Services 에직접연결 Power BI Development API 소개 Power BI 의사용자지정비주얼활용방법 무엇을배우나요? Connect, import, shape, and transform data Create and share dashboards based on for business intelligence (BI) reports in Power BI desktop and Excel Visualize data, author reports, and schedule Use natural language queries automated refresh of your reports Create real-time dashboards 강사소개 Will Thompson Jonathan Sanito Program Manager, Power BI Senior Content Developer Microsoft Microsoft Kim Manis Miguel Llopis Program Manager Microsoft Senior Program Manager Microsoft
Course 4 : Essential Statistics for Data Analysis using Excel 예상학습기간 : 6 주 1 주일에 2~4 시간학습권고주관기관 : Microsoft 주제 : Computer Science 레벨 : 중급동영상강의 : 한글 / 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 과정에포함되어있습니다. 데이터분석가로서의취업과경력을쌓기를고려하고있다면히스토그램, 파레토차트, 박스플롯, 베이즈이론등을알아야합니다. Microsoft Excel 데이터사이언스두번째응용통계과정에서는엑셀에내장된강력한도구를활용하고개념적관점과응용관점에서통계및기본확률의핵심원칙을탐구합니다. 기술통계, 기본확률, 무작위변수, 샘플링및신뢰구간및가설테스트에대해배웁니다. 엑셀의환경, 기능및시각화를사용하여이러한개념과원칙을적용하는방법을살펴보십시오. 데이터사이언티스트가데이터를분석하는기능은의사결정을내리는데큰지표가되며통계및기본확률의견고한기초는데이터를더잘이해하는데도움이됩니다. 의료, 비즈니스, 스포츠, 보험등많은업계에적용할수있는실제개념을사용하여엑셀이데이터분석을위한최고의도구중하나인이유와엑셀의기본기능이엑셀을훌륭한방법으로만드는이유에대해최고의전문가로부터배우십시오. 선행학습 중등학교 ( 고등학교 ) 대수학 엑셀에서테이블, 수식및차트로작업할수있는기능 테이블, 피벗테이블및피벗차트와같은엑셀분석도구를사용하여데이터를구성하고요약하는능 강의계획서 모듈 1: 기술통계 차트및기본통계측정을사용하여데이터를분석하는방법을배우게됩니다. Excel 2016 의새로운 히스토그램, 파레토차트, 박스플롯및트리맵및선버스트차트를모두사용합니다. 모듈 2: 기본확률
보완법칙, 독립사건, 조건부확률및베이즈이론을비롯한기본적인확률을배웁니다. 모듈 3: 무작위변수 임의변수의평균과분산을찾는방법을배우고이항분포, 포아송분포, 정규확률변수에대해 배웁니다. 매우중요한중심극한정리에대한논의로끝맺습니다. 모듈 4: 샘플링및신뢰구간 샘플링, 점추정및모집단매개변수의간격추정에대한메커니즘을학습합니다. 모듈 5: 가설테스트 귀무가설과대립가설, 타입 I 오류와타입 II 오류, 평균및비율에대한표본검정, 두모집단평균의 차이에대한검정및독립변수에대한카이제곱검정을배우게됩니다. 무엇을배우나요? Descriptive statistics Sampling and confidence intervals Basic probability Hypothesis testing Random variables 강사소개 Liberty J. Munson Matthew Minton Principal Psychometrician and Quality Lead Microsoft Senior Content Publishing Manager Microsoft Wayne Winston Professor Emeritus of Decision Sciences at the Kelly School of Business Indiana University
UNIT2 데이터사이언스의핵심 Course 5a : Introduction to R for Data Science 예상학습기간 : 4 주 1 주일에 2~3 시간학습권고주관기관 : Microsoft 주제 : Computer Science 레벨 : 입문동영상강의 : 한글 / 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 과정에포함되어있습니다. R 은데이터사이언스및통계분야의선도언어로빠르게자리매김하고있습니다. 오늘날 R 은모든업계및분야의데이터사이언스전문가에게가장적합한도구입니다. 대형컴퓨터또는가끔데이터분석가의필요에의해사용하든상관없이 R 은다양한사용자의요구에맞을것입니다. R 프로그래밍과정에대한소개는 R 의기본사항을익히는데도움이됩니다. 총 7 개섹션에서 R 을학습하며자신의첫번째데이터분석을수행할수있도록기본적인구문을다룰것입니다. 변수및기본연산을시작으로벡터, 행렬, 데이터프레임과리스트와같은데이터구조를처리하는방법을배우게됩니다. 마지막섹션에서는 R 의그래픽기능에대해자세히알아보고멋진시각적데이터를표현하기위해시각화를배웁니다. 이과정을학습하기위해서는프로그래밍언어나데이터사이언스에대한사전지식이필요하지않습니다. 이과정의학습자들이더욱유익하게학습할수있는이유는 DataCamp 플랫폼을사용하여양방향대화식브라우저코딩문제를통해새로습득한기술을지속적으로연습할수있도록코딩실습환경을제공한다는것입니다. 수동적으로동영상강의만을보는대신실제데이터문제를풀어보고동시에올바른솔루션을안내하는즉각적이고개인화된피드백을받게됩니다 선행학습 특별히없지만기본수학능력은도움이됩니다. 강의계획서 섹션 1: 기본소개 R 을사용하여첫번째단계를학습하며, R 의기본데이터유형을발견하고첫번째변수를 지정하십시오. 섹션 2: 벡터 벡터를사용하여도박행위를분석합니다. 벡터에서요소를만들고이름을지정하고선택합니다.
섹션 3: 행렬 R 의행렬작업방법을배우십시오. 스타워즈박스오피스통계를분석하여기본계산을수행하고 학습내용을검증하십시오.. 섹션 4: 요소 R 은범주데이터를요소로저장합니다. 카테고리데이터를생성, 하위집합및비교하는방법에대해 알아보십시오. 섹션 5: 데이터프레임 R 작업을할때는항상데이터프레임을처리해야합니다. 그러므로데이터프레임을생성하고, 그중 가장흥미로운부분을선택하고, 그것들을처리하는방법을알아야합니다. 섹션 6: 목록 목록을사용하면여러유형의구성요소를저장할수있습니다. 6 절에서는목록을다루는방법을 보여줍니다. 섹션 7: 기본그래픽 R 패키지를통해그래픽작업을하고자신만의데이터시각화를만들수있습니다 무엇을배우나요? Introductory R language fundamentals and Become familiar with the major R data basic syntax structures What R is and how it s used to perform Create your own visualizations using R data analysis 강사소개 Filip Schouwenaars Jonathan Sanito Filip 은 DataCamp 의대화형교육과정의많은주요배움터개발자입니다. 그의과정과지도서는이미전세계수천명의학생들이수강했습니다. DataCamp 는 370 만회이상의양방향연습을완료한 250,000 명이상의데이터과학자를교육했습니다 Jonathan 은마이크로소프트의콘텐츠개발자및프로젝트관리자로 Data and Analytics 온라인교육에중점을둡니다. 마이크로소프트 Dynamics NAV 에서 Windows Active Directory 에이르기까지개발자및 IT 전문가를대상으로한교육을담당했습니다.
Course 5b : Introduction to Python for Data Science 예상학습기간 : 6 주 1 주일에 2~4 시간학습권고주관기관 : Microsoft 주제 : Computer Science 레벨 : 입문동영상강의 : 한글 / 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 및 Artificial Intelligence 과정에 포함되어있습니다. 파이썬은많은다른응용프로그램에사용되는매우강력한프로그래밍언어입니다. 시간이지남에따라이오픈소스언어를둘러싼거대한커뮤니티는파이썬으로보다효율적으로작업할수있는도구를많이만들고있습니다. 최근몇년동안데이터사이언스를위해특별히제작된여러도구가있습니다. 결과적으로파이썬으로데이터를분석하는것이결코쉬운일은아닙니다. 이실습에서는처음부터기본산술및변수를사용하여시작하고파이썬목록, Numpy 배열및 Pandas DataFrames 와같은데이터구조를처리하는방법을배웁니다. 순서에따라파이썬함수와제어흐름을배우게됩니다. 또한파이썬을사용하여데이터시각화방법을살펴보고실제데이터를기반으로멋진시각화를배우게됩니다. 선행학습 엑셀, 데이터베이스또는텍스트파일을활용한데이터작업경험 강의계획서 섹션 1: Python Basics 파이썬세계에첫발을내딛으십시오. 다른데이터유형을발견하고첫번째변수를만듭니다. 섹션 2: Python Lists 하나의이름으로다양한데이터요소를저장하는첫번째방법을알수있습니다. 모든종류의 방법으로목록을작성, 부분집합및생성하는방법을배웁니다. 섹션 3: Functions and Packages 파이썬패키지가져오기와함수호출을통하여다른사람들의개발모듈을최대한활용하는방법을 배웁니다.
섹션 4: Numpy 방대한양의데이터를효율적으로저장하고계산할수있는방법인 Numerical Python 으로초고속 코드를작성하십시오. 섹션 5: Matplotlib 전달하려는메시지에따라다양한시각화유형을생성하십시오. 실제데이터를기반으로복잡하고 사용자정의된플롯을작성하는방법을익히십시오. 섹션 6: Control flow and Pandas 조건부구문을작성하여스크립트의실행을조정하고 Pandas DataFrame( 파이썬의데이터사이언스 핵심데이터구조 ) 을익히십시오. 무엇을배우나요? Explore Python language fundamentals, Build Numpy arrays, and perform including basic syntax, variables, and types interesting calculations Create and manipulate regular Python lists Create and customize plots on real data Use functions and import packages Supercharge your scripts with control flow, and get to know the Pandas DataFrame 강사소개 Filip Schouwenaars Jonathan Sanito Filip 은 DataCamp 의대화형교육과정의많은주요배움터개발자입니다. 그의과정과지도서는이미전세계수천명의학생들이수강했습니다. DataCamp 는 370 만회이상의양방향연습을완료한 250,000 명이상의데이터과학자를교육했습니다 Jonathan 은마이크로소프트의콘텐츠개발자및프로젝트관리자로 Data and Analytics 온라인교육에중점을둡니다. 마이크로소프트 Dynamics NAV 에서 Windows Active Directory 에이르기까지개발자및 IT 전문가를대상으로한교육을담당했습니다
Course 6 : Data Science Essentials 예상학습기간 : 6 주 1 주일에 3~4 시간학습권고주관기관 : Microsoft 주제 : Computer Science 레벨 : 중급동영상강의 : 한글 / 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 및 Artificial Intelligence 과정에 포함되어있습니다. 데이터사이언스인재에대한수요가전세계적으로급증하고있습니다. Duke University 및 Microsoft 의전문가들과함께필수기술과원칙을학습하면서데이터사이언티스트가되기위한경력을개발하십시오. 이데이터사이언스과정에서는 Microsoft Azure Machine Learning 플랫폼을사용하여클라우드기반데이터사이언스솔루션을구축하는방법, Azure stack 기반에 R 및파이썬과같은실용적인응용프로그램지향적인내용을학습하며, 데이터수집, 준비, 탐색및시각화에대한주요개념들을배우게됩니다. 선행학습 기초수학능력 R 또는파이썬에대한입문레벨지식 강의계획서 데이터사이언스프로세스탐구 - 소개 데이터사이언스사고이해 데이터사이언스과정이해 AML(Azure Machine Learning) 을사용하여첫번째머신러닝실험을작성하는방법 Lab: Azure Machine Learning 에서첫번째모델만들기, 데이터사이언스에서확률및통계 신뢰구간과가설검정을이해하고적용 상관관계의의미와적용이해하기, 시뮬레이션을적용하는방법 Lab : 확률및통계작업 Lab : 시뮬레이션및가설테스트데이터작업 데이터처리및선택방법의기초파악 데이터정리, 통합및변환의중요성과프로세스이해
Lab : 데이터처리및선택 Lab : Azure Machine Learning 을활용한데이터통합, Azure stack 의 R 및파이썬을활용한데이터탐색및시각화 기본플롯유형을생성하고해석하는방법을익히십시오. Datasets 탐색프로세스이해 Lab: Azure Machine Learning 을활용한데이터탐색및시각화, 지도학습을위한 R 과파이썬소개 지도학습의기본개념이해 자율학습 ( 비지도학습 ) 의기본개념이해 AML 을이용하여간단한머신러닝모델만들기 Lab: 소득별국민분류 Lab: 회귀분석을통한자동차가격예측 Lab: Azure Machine Learning 을통한 K-평균클러스터링 무엇을배우나요? Explore the data science process Introduction to machine learning Probability and statistics in data science The hands-on elements of this course Data exploration and visualization leverage a combination of R, Python, Data ingestion, cleansing, and and Microsoft Azure Machine Learning transformation 강사소개 Graeme Malcolm Steve Elston Senior Content Developer Microsoft Learning Experiences Cynthis Rudin Managing Director Quantia Analytics, LLC Associate Professor MIT and Duke
Course 7 : Principles of Machine Learning 예상학습기간 : 6 주 1 주일에 3~4 시간학습권고주관기관 : Microsoft 주제 : Computer Science 레벨 : 중급동영상강의 : 한글 (7 월 )/ 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 및 Artificial Intelligence 과정에 포함되어있습니다. 머신러닝은컴퓨터를사용하여미래의행동, 결과및추세를예측하기위해기존데이터로부터학습하는예측모델을실행합니다. 이데이터사이언스과정에서는실용적인시나리오및실습경험을바탕으로머신러닝이론을명확하게설명하고머신러닝모델을검증및배포합니다. R, Python 및 Azure Machine Learning 을사용하여이러한모델에서통찰력을구축하고파생시키는방법을배우게됩니다. 강의계획서 분류탐색 (Explore classification) 분류기의작동이해 분류기준으로로지스틱회귀분석사용 분류기준평가에사용되는측정항목이해 Lab : 로지스틱회귀분석 머신러닝의회귀 (Regression in machine learning) 회귀모델의이해 예측을위한선형회귀분석사용 회귀모델을평가하는데사용되는지표이해 Lab : Azure Machine Learning 을사용하여선형회귀로자전거수요예측 지도학습모델을개선하는방법 피처선택을위한프로세스 매개변수초과의문제와차원의저주에대한이해 매개변수초과모델에대해정규화사용 차원감소방법 - 추정모델유효성평가를위한교차검증적용 Lab : Azure Machine Learning 을사용하여당뇨병환자분류개선
Lab : Azure Machine Learning 을사용하여자전거수요예측개선 비선형모델링에대한세부정보 일반적으로지도된머신러닝모델을언제어떻게사용해야하는지이해하기 - ML 모델을당뇨병환자분류에적용 ML 모델을자전거수요예측클러스터링에적용 비지도학습모델의원리이해 k-평균클러스터링모델을올바르게적용하고평가 첨단클러스터링모델을올바르게적용하고평가 Lab : AML, R, 파이썬을활용한클러스터모델 추천시스템 추천시스템의동작원리이해 추천시스템을평가하는방법이해 추천을위한공동작업필터링대안사용방법 Lab : 추천작업및평가 무엇을배우나요? Explore classification Recommender systems Regression in machine learning The hands-on elements of this course How to improve supervised models leverage a combination of R, Python, Details on non-linear modeling and Microsoft Azure Machine Learning Clustering 강사소개 Graeme Malcolm Steve Elston Senior Content Developer Microsoft Learning Experiences Cynthis Rudin Managing Director Quantia Analytics, LLC Associate Professor MIT and Duke
UNIT3 데이터사이언스의응용 Course 8a : Programming with R for Data Science 예상학습기간 : 6 주 1 주일에 4~8 시간학습권고주관기관 : Microsoft 주제 : Computer Science 레벨 : 중급동영상강의 : 한글 (7 월 )/ 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 과정에포함되어있습니다. 덴마크의 Technical University (DTU) 와공동으로개발한이과정은컴퓨터사이언스분야에서필요한지식과기술을습득합니다. 이과정에서는 R 로프로그래밍하는방법을배우게됩니다. R 데이터구조와구문을탐색하고, 로컬파일에서 cloud-hosted 데이터베이스로데이터를읽고쓰는방법, 데이터로작업하는방법, 요약을하는방법, 또한필요에맞게데이터를변형하는방법을배우게됩니다. 또한 R 을사용하여예측분석을수행하는방법과널리사용되는 ggplot2 패키지를사용하여시각화를만드는방법을학습해보십시오. 선행학습 UNIT2: 데이터사이언스를위한 R 입문과정 강의계획서 Section 1: Introduction Section 2: Functions Section 3: Control flow and Loops Section 4: Working with Vectors and Matrices Section 5: Reading in Data Section 6: Writing Data Section 7: Reading from SQL Server Section 8: Working with Data Section 9: Manipulating Data Section 10: Simulation Section 11: Linear model
Section 12: Graphics in R 무엇을배우나요? Explore R language fundamentals, including Work with data in R basic syntax, variables, and types Create and customize visualizations How to create functions and use control using ggplot2 flow. Perform predictive analytics using R Details on reading and writing data in R 강사소개 Anders Stockmarr Statistician Jonathan Sanito Senior Content Developer Microsoft
Course 8b : Programming with Python for Data Science 예상학습기간 : 6 주 1 주일에 8~9 시간학습권고주관기관 : Microsoft 주제 : Computer Science 레벨 : 중급동영상강의 : 한글 (8 월 )/ 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 과정에포함되어있습니다. Coding Dojo 와공동으로개발한이실용적인과정은 Python 프로그래밍입문학습을선행한학습자를대상으로합니다. 데이터사이언티스트에게가장인기있는언어중하나인파이썬은유용한정보를발굴하기위한잘알려진마이닝모델을적용하여데이터사이언티스트로서데이터를다루는방법을배울수있습니다. 데이터시각화, 피처의중요성및선택, 차원감소, 클러스터링, 분류등의주제가포함됩니다. 이과정에서사용되는모든 data sets 는실시간데이터로수집되거나머신러닝으로부터실제유용한정보를얻을수있는방법을학습합니다. 선행학습 UNIT2: 데이터사이언스를위한파이썬입문과정 무엇을배우나요? What machine learning is and the types of problems it is adept to solving How to represent raw data in a manner conducive to deriving valuable information How to use various data visualization techniques How to use principal component analysis and isomap intelligently to simplify your data How to apply supervised learning algorithms to your data, such as random forest and support vector classifier Concepts such as model selection, pipelining, and cross validation 강사소개 Autjman Apatira Jonathan Sanito Lead Instructor Coding Dojo Senior Content Developer Microsoft
Course 9a : Implementing Predictive Analytics with Spark in Azure HDInsight 예상학습기간 : 6 주 1 주일에 3~4 시간학습권고주관기관 : Microsoft 주제 : Computer Science 레벨 : 고급동영상강의 : 한글 (7 월 )/ 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 및 Big Data 과정에포함되어 있습니다. 빅데이터과학에대한학습준비가되셨습니까? 이과정에서는 Microsoft Azure HDInsight 에서아파치스파크를사용하여대용량데이터에대한예측분석솔루션을구현하는방법을학습합니다. 스칼라또는파이썬을사용하여데이터를정리및변환하고 Spark ML 로머신러닝모델을작성하는방법을배워보십시오. 참고 : 이과정의실습을진행하려면 Azure 구독과 Windows 클라이언트컴퓨터가필요합니다. 무료 Azure 평가판가입을신청할수있습니다 ( 확인을위해서는유효한신용카드가필요하지만 Azure 서비스에대해서는비용이청구되지않습니다 ). 선행학습 Azure HDInsight 경험 데이터베이스및 SQL 에대한지식. 프로그래밍경험. 강의계획서 Spark 를활용한데이터사이언스개론 Azure HDInsight 에서스파크클러스터를시작하고스파크를사용하여파이썬또는스칼라를실행하여 데이터작업을수행하십시오. 머신러닝시작하기 Spark ML 라이브러리를사용하여분류및회귀모델을작성하는방법을배웁니다. 머신러닝모델평가 지도학습모델을평가하는방법과모델매개변수를최적화하는방법에대해알아보십시오.
추천자및비지도학습모델 Spark ML 을사용하여추천구축및클러스터링모델을작성하는방법을익히십시오 무엇을배우나요? Using Spark to explore data and prepare Evaluate and optimize models for modeling Build recommenders and unsupervised Build supervised machine learning models machine learning models 강사소개 Graeme Malcolm Senior Content Developer Microsoft Learning Experiences
Course 9b : Analyzing Big Data with Microsoft R 예상학습기간 : 4 주 1 주일에 2~4 시간학습권고주관기관 : Microsoft 주제 : Data Analysis & Statistics 레벨 : 고급동영상강의 : 한글 (8 월 )/ 영어 과정소개 이과정은 Microsoft Professional Program Certificate in Data Science 및 Big Data 과정에포함되어 있습니다. 오픈소스프로그래밍언어 R 은데이터처리및통계분석을위해오랜기간 ( 특히학계에서 ) 인기있는언어입니다. R 의장점중하나는간결한프로그래밍언어이며또한모든종류의분석을수행할수있는제 3 자라이브러리의광범위한저장소가있다는것입니다. 이두기능을함께사용하면데이터데이터사이언티스트가원시데이터에서요약, 차트및전체보고서로신속하게만들어낼수있습니다. 그러나 R 의한가지부족한점은전통적으로많은양의메모리를사용한다는것입니다. 왜냐하면데이터복사본을 data.frame 개체로전체적으로로드해야하기때문에데이터를처리할때종종추가복사본을생성하기때문입니다 (copy-on-modify 라고함 ). 이것은 R 이학계에비해산업계에더마지못해받아들여진이유중하나입니다. Microsoft R Server (MRS) 의주요구성요소는 R 라이브러리에있는 RevoScaleR 패키지입니다. 이라이브러리는대규모데이터세트를메모리에한꺼번에로드하지않고도처리할수있는일련의기능을제공합니다. RevoScaleR 은시간이지남에따라추가되는다양한통계및머신러닝알고리즘을공유합니다. 마지막으로, RevoScaleR 은우리가랩톱에서개발한코드를가져와서최소한의노력으로 SQL Server 또는스파크 ( 인프라가전혀다른곳 ) 에원격배포할수있는메커니즘을제공합니다. 이과정에서는 MRS 를사용하여대규모데이터집합에대한분석을실행하고 SQL Server 데이터베이스에이를배포하는방법에대한몇가지예를제공합니다. 이과정을완료하면빅데이터처리를위해 R 을사용하는방법을알게됩니다. RevoScaleR 은 R 패키지이므로과정학습자는 R 에익숙하다고가정합니다. R 데이터구조 ( 벡터, 행렬, 목록, 데이터프레임, 환경 ) 에대한확실한이해가필요합니다. dplyr 과같은타사패키지에익숙한것도학습에도움이됩니다 선행학습 데이터사이언스를위한 R 입문및데이터사이언스를위한 R 프로그래밍 무엇을배우나요?
MRS(Microsoft R Server) 를사용하여대형 datasets 을읽고, 처리하고, 분석하는방법을배우게됩니다. Read data from flat files into R s data frame Calculate essential summary statistics, do object, investigate the structure of the crosstabulation, write your own summary dataset and make corrections, and store functions, and visualize data with the prepared datasets for later use ggplot2 package Prepare and transform the data Build predictive models, evaluate and compare models, and generate predictions on new data 강사소개 Jonathan Sanito Seth Mottaghinejad Senior Content Developer Microsoft Data Scientist Microsoft