Lab-Buildamatrix Copyright 2018 document created by Introduction PDF 파일다운로드 Machin Learning의두번째랩은 Pandas와 Numpy를활용하여 Rating M

Similar documents
Lab-Numpyinanutshell Copyright 2018 document created by Introduction PDF 파일다운로드 오래기다리셨습니다. 드디어 Machin Learning 강의첫번째 Lab Assi

다운로드된 lab_normal_equation.zip 파일을작업폴더로이동한후압축해제후작업하시길바랍니다. 압축해제하면폴더가 linux_mac 과 windows 로나눠져있습니다. 자신의 OS에맞는폴더로이동해서코드를수정해주시기바랍니다. linear_model.py 코드 구조

Lab - Gradient descent Copyright 2018 by Introduction [PDF 파일다운로드 ]() 이번랩은우리가강의를통해들은 Gradient descent 을활용하여 LinearRegression

Lab #4 - 화씨변환기 (fahrenheit_converter) Copyright 2015 document created by Introduction 4 주차강의 Lab Assignment 입니다. 이번 lab 은더짧고더

Microsoft Word - ntasFrameBuilderInstallGuide2.5.doc

1. Windows 설치 (Client 설치 ) 원하는위치에다운받은발송클라이언트압축파일을해제합니다. Step 2. /conf/config.xml 파일수정 conf 폴더에서 config.xml 파일을텍스트에디터를이용하여 Open 합니다. config.xml 파일에서, 아

리눅스설치가이드 3. 3Rabbitz Book 을리눅스에서설치하기위한절차는다음과같습니다. 설치에대한예시는우분투서버 기준으로진행됩니다. 1. Java Development Kit (JDK) 또는 Java Runtime Environment (JRE) 를설치합니다. 2.

Mango-IMX6Q mfgtool을 이용한 이미지 Write하기

1) 인증서만들기 ssl]# cat > // 설명 : 발급받은인증서 / 개인키파일을한파일로저장합니다. ( 저장방법 : cat [ 개인키

NTD36HD Manual

SBR-100S User Manual

1) 인증서만들기 ssl]# cat > // 설명 : 발급받은인증서 / 개인키파일을한파일로저장합니다. ( 저장방법 : cat [ 개인키

Microsoft Word - windows server 2003 수동설치_non pro support_.doc

아래 항목은 최신( ) 이미지를 모두 제대로 설치하였을 때를 가정한다

OnTuneV3_Manager_Install

ICAS CADWorx SPLM License 평가판설치가이드

IRISCard Anywhere 5

Cubase AI installation guide

Index

Studuino소프트웨어 설치

!K_InDesginCS_NFH

Report Designer V3.0 사용설명서 2장

Windows 8에서 BioStar 1 설치하기

¿ÀǼҽº°¡À̵å1 -new

문서의 제목 나눔고딕B, 54pt

목차 윈도우드라이버 1. 매뉴얼안내 운영체제 (OS) 환경 윈도우드라이버준비 윈도우드라이버설치 Windows XP/Server 2003 에서설치 Serial 또는 Parallel 포트의경우.

메일서버등록제(SPF) 인증기능적용안내서 (HP-UX - postfix) OS Mail Server SPF 적용모듈 (Perl 기반) 작성기준 HP-UX 11.11i postfix spf-filter 년 6 월

ISP and CodeVisionAVR C Compiler.hwp

PowerPoint Template

Microsoft Word - Windows_apahce_php_CUBRID2008

Microsoft PowerPoint SDK설치.HelloAndroid(1.5h).pptx

문서의 제목 나눔고딕B, 54pt

슬라이드 1

..,. Job Flow,. PC,.., (Drag & Drop),.,. PC,, Windows PC Mac,.,.,. NAS(Network Attached Storage),,,., Amazon Web Services*.,, (redundancy), SSL.,. * A

Microsoft PowerPoint Android-SDK설치.HelloAndroid(1.0h).pptx

슬라이드 1

기술통계

Microsoft PowerPoint - [Practice #1] APM InstalI.ppt

메일서버등록제(SPF) 인증기능적용안내서 (HP-UX - qmail) OS Mail Server SPF 적용모듈 (Perl 기반) 작성기준 HP-UX 11.11i qmail 1.03 spf-filter 년 6 월

Poison null byte Excuse the ads! We need some help to keep our site up. List 1 Conditions 2 Exploit plan 2.1 chunksize(p)!= prev_size (next_chunk(p) 3

1

1. 도구개요 CppUnit Testing 소개 CppUnit 는 C++ 용 testing Framework 로 Java 의 JUnit 을 C++ 로구현 C++ 언어에서사용할수있도록개발된 Open Source 프로젝트로, source code 의특정 Module 이의도

Index 1. Intro Install Connect Scratch 1.4 (Offline Editor) Scratch 2.0 (Online Editor) Connect f

Microsoft PowerPoint - 안드로이드 개발 환경 구축(170411)

Splentec V-WORM Quick Installation Guide Version: 1.0 Contact Information 올리브텍 주소 : 경기도성남시분당구구미로 11 ( 포인트타운 701호 ) URL: E-M

Internet Explorer 11 자동업데이트방지 사용자가이드 작성일 : Version 1.0

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

Master Node 구축 Guide 가입후마스터노드구축에필요한서버를임대하여야합니다. 2. 원하시는서버가설치된국가선택후하단의이미지와같이 Server Type을 Ubuntu x 버전으로선택하시고마스터노드구

Webtob( 멀티도메인 ) SSL 인증서갱신설치가이드 본문서는주식회사한국기업보안에서 SSL 보안서버인증서설치를위해작성된문서로 주식회사한국기업보안의동의없이무단으로사용하실수없습니다. [ 고객센터 ] 한국기업보안. 유서트기술팀 Copyright 201

슬라이드 1

JDK이클립스

PowerPoint 프레젠테이션

Microsoft Word _mentor_conf_output5.docx

Microsoft PowerPoint - XUSB_제품메뉴얼_140206

IP Cam DDNS 설정설명서(MJPEG) hwp

Microsoft PowerPoint - 11주차_Android_GoogleMap.ppt [호환 모드]


6. 설치가시작되는동안 USB 드라이버가자동으로로드됩니다. USB 드라이버가성공적으로로드되면 Setup is starting( 설치가시작되는중 )... 화면이표시됩니다. 7. 화면지침에따라 Windows 7 설치를완료합니다. 방법 2: 수정된 Windows 7 ISO

PowerPoint 프레젠테이션

Windows Server 8

메일서버등록제(SPF) 인증기능적용안내서 (AIX - sendmail) OS Mail Server SPF 적용모듈 (Perl 기반) 작성기준 AIX 5.3 sendmail spf-filter 년 6 월

tiawPlot ac 사용방법

데이터 시각화

JAVA 플랫폼 개발 환경 구축 및 활용

지난시간에... 우리는 kernel compile을위하여 cross compile 환경을구축했음. UBUNTU 12.04에서 arm-2009q3를사용하여 간단한 c source를빌드함. 한번은 intel CPU를위한 gcc로, 한번은 ARM CPU를위한 gcc로. AR

Chapter 1

PowerPoint 프레젠테이션

Keil Flexlm 라이선스 설명서

관세사솔루션 설치매뉴얼

SBR-100S User Manual

ActFax 4.31 Local Privilege Escalation Exploit

Microsoft PowerPoint - e pptx

기존에 Windchill Program 이 설치된 Home Directory 를 선택해준다. 프로그램설치후설치내역을확인해보면 Adobe Acrobat 6.0 Support 내역을확인할수 있다.

¿©¸§È£1

PowerPoint 프레젠테이션

Raspbian 설치 라즈비안 OS (Raspbian OS) 라즈베리파이 3 Model B USB 마우스 USB 키보드 마이크로 SD 카드 마이크로 SD 카드리더기 HDM I 케이블모니터

Data Sync Manager(DSM) Example Guide Data Sync Manager (DSM) Example Guide DSM Copyright 2003 Ari System, Inc. All Rights reserved. Data Sync Manager

슬라이드 1

문서의 제목 나눔고딕B, 54pt

Table of contents 1. 구성도 Maxgauge For MySQL 설치정보... 6 설치파일정보... 6 포트정보... 6 주요디렉토리... 6 소프트웨어기동 / 종료... 7 기동... 7 종료 Maxgauge For MySQ

Windows Server 2012

행자부 G4C

Network Security - Wired Sniffing 실습 ICNS Lab. Kyung Hee University

Microsoft PowerPoint - gnu-w06-python_[실습]_day13-turtle-shape

목차 백업 계정 서비스 이용 안내...3 * 권장 백업 정책...3 * 넷하드(100G 백업) 계정 서버로 백업하는 2가지 방법...3 * 백업서버 이용시 주의사항...3 WINDOWS 서버 사용자를 위한 백업서비스 이용 방법 네트워크 드라이브에 접속하여

디럭스바이블 2005 설치가이드 ( 주 ) 미션소프트 TEL FAX 디럭스바이블 2005 설치가이드 DeluxeBible 2005

내지-2도뻂

intro

영상5월_펼침면

Packstack 을이용한 Openstack 설치

Endpoint Protector - Active Directory Deployment Guide

dist=dat[:,2] # 기초통계량구하기 len(speed) # 데이터의개수 np.mean(speed) # 평균 np.var(speed) # 분산 np.std(speed) # 표준편차 np.max(speed) # 최대값 np.min(speed) # 최소값 np.me

SIGIL 완벽입문

SQL Developer Connect to TimesTen 유니원아이앤씨 DB 기술지원팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 작성자

FON_이용안내_A4_ _01.pub

Microsoft Word - 3부A windows 환경 IVF + visual studio.doc

4S 1차년도 평가 발표자료

BEA_WebLogic.hwp

Transcription:

Lab-Buildamatrix Copyright 2018 document created by teamlab.gachon@gmail.com Introduction PDF 파일다운로드 Machin Learning의두번째랩은 Pandas와 Numpy를활용하여 Rating Matrix 또는 Frequent Matrix 를만드는것입니다. 추천시스템개발등머신러닝을하다보면누가, 어떤물건 ( 또는서비스 ) 를얼마나이용하고평가하였는가를 Matrix 형태로변형하여분석하는일이많은데이를위한전처리과정이필요합니다. 흔한예제로생각해보면영화를본사용자들이각영화를평가한별점점수를 Matrix 형태로표현하는것이있습니다. 일반적으로데이터베이스는저장공간의효율성을위해 Matrix 형태로저장하는것이아니라 Event과발생한정보를 Row 단위로저장합니다. 이렇게 DB에쌓인정보를 Matrix로변환하는게이번랩의목표입니다. 실제데이터의변환은아래그림과같습니다. backend.ai 설치 숙제를제출하기앞서, 레블업의 backend.ai 를여러분의파이썬에설치하셔야합니다. 설치하는과정은매우 쉽습니다. 아래처럼터미널또는 cmd 창에서입력을하시면됩니다. pip install backend.ai-client 숙제 파일 (lab_bulid_matrix.zip) 다운로드

먼저해야할일은숙제파일을다운로드받는것입니다. 아래링크를다운로드하거나 Chrome 또는익스플 로러와같은웹브라우저주소창에아래주소를입력합니다. 링크 lab_numpy.zip https://s3.ap-northeast-2.amazonaws.com/teamlabgachon/mooc_pic/2_lab_bulid_matrix.zip 또는 Mac OS 에서는아래명령을쓰셔도됩니다. wget https://s3.ap-northeast-2.amazonaws.com/teamlab-gachon/mooc_pic/2_lab_buli 다운로드된 lab_bulid_matrix.zip 파일을작업폴더로이동한후압축해제후작업하시길바랍니다. 압축해제하면폴더가 linux_mac 과 windows 로나눠져있습니다. 자신의 OS에맞는폴더로이동해서코드를수정해주시기바랍니다. bulid_matrix.py 코드 구조 본 Lab 은 Pandas 의기본적인동작과 Numpy 를결합하여일반적으로쌓여있는데이터를 Matrix 형태로변 경합니다. 변환되는 Matrix 형태는두가지이며, 본 Lab 도두가지모두를지원하는것을목표로합니다. get_rating_matrix 첫번째함수는 Rating Matix 을만드는것입니다. Rating Matrix 는영화, 책처럼사용자가제품에대한평 가를 Matrix 형태로표현한것입니다. 저희는 movie_rating.csv 라는파일을활용하여 rating matrix 를 구성한다. movie_rating.csv 는아래처럼구성된다. source target rating Mick LaSalle Superman Returns 3.0 Mick LaSalle The Night Listener 3.0 Claudia Puig Snakes on a Plane 3.5 Claudia Puig Just My Luck 3.0 Claudia Puig The Night Listener 4.5

Lisa Rose Lady in the Water 2.5 Lisa Rose Snakes on a Plane 3.5 본랩에서다루는모든 csv 파일의 column 은 source, target 으로구성되며, source 는 row 의 index 정보 가, target 는 column 의기준정보가된다. rating 정보는 get_rating_matrix 함수에서만사용되며, 사용 자가영화에대한평가를정보를담고있다. 본랩의목적은위테이블과같이구성된정보를 Matrix 형태로바꾸는거다. Matrix 형태로바꾸는규칙은다 음과같다. source는 row, target은 column의기준이된다. source와 target의정렬된값을활용하여 index를설정한다. 즉위 Table에서는 Claudia Puig 과 row의 0번째 index로설정된다. rating의정보는 Matrix에서각 Element 값에할당된다. 생성되는 Matrix Ndarray로나타난다. dict, collection 모듈등파이썬의 Built-in Module은사용할수있으나, for 문은사용할수없다. 생성하는함수의 Template 은아래와같으며, 입력값은처리하는 csv 파일의이름만넣을수있다. def get_rating_matrix(filename): pass 실제한구현한예제와결과물은아래와같다. >>> import numpy as np >>> import build_matrix as test_code >>> test_code.get_rating_matrix("movie_rating.csv") array([[ 3., 0., 3.5, 0., 4.5, 0. ], [ 0., 3., 3.5, 0., 3., 3.5], [ 0., 3., 4., 5., 3., 3.5], [ 3., 2.5, 3.5, 3.5, 3., 2.5], [ 2., 3., 4., 3., 3., 0. ], [ 0., 0., 4.5, 4., 0., 0. ]], dtype=float32) get_frequent_matrix 두번째함수는얼마나빈번하게제품을구매했는지를표현하는 Frequent Matrix 를만드는것입니다. Frequent Matrix 는사용자가특정제품을구매한횟수를기록하는 Matrix 이다. 저희가제공하는 csv 파일은 1000i.csv 라는파일로아래처럼구성되어있습니다.

source target source,target 3 7 4 15 2 49 5 44 1 1 2 19 4 22 4 34 4 40 5 31 4 17 5 16 2 43 5 20 3 48 본함수에서는기존함수와달리 Rating column 이없습니다. 대시신 source 와 target 의조합이한개이상 으로중복될수있고, 이것이 Frequent 로처리해야합니다. 즉 Rating 이명시적으로있는게아니라데이터를 통해 Frequent 를찾아내는것이목적입니다. Matrix 형태로바꾸는규칙은다음과같습니다. source는 row, target은 column의기준이된다. source와 target의정렬된값을활용하여 index를설정한다. 즉위 Table에서는 1 은 row의 0번째 index로설정된다. Source와 Target이출현한정보는 Frequent로 Matrix에서각 Element 값에할당되어야한다. 생성되는 Matrix Ndarray로나타내며, dtype은 np.float32 dict, collection 모듈등파이썬의 Built-in Module은사용할수있으나, for 문은사용할수없다. 생성하는함수의 Template 은아래와같으며, 입력값은처리하는 csv 파일의이름만넣을수있다.

def get_frequent_matrix(filename): pass 실제한구현한예제와결과물은아래와같다. >>> import numpy as np >>> import build_matrix as test_code >>> test_code.get_frequent_matrix("1000i.csv") array([[ 19., 17., 14., 11., 17., 25., 7., 22., 5., 18., 10., 13., 13., 8., 20., 10., 9., 10., 16., 15., 9., 11., 17., 15., 14., 8., 6., 12., 18., 12., 6., 18., 9., 24., 7., 19., 14., 6., 4., 12., 15., 14., 20., 9., 12., 16., 11., 9., 11., 12.], [ 20., 16., 10., 15., 17., 18., 10., 13., 5., 19., 8., 14., 14., 9., 15., 14., 13., 8., 12., 9., 5., 10., 28., 18., 7., 8., 6., 19., 14., 13., 11., 12., 18., 15., 7., 11., 17., 9., 5., 5., 13., 12., 15., 9., 13., 16., 16., 10., 16., 9.], [ 12., 16., 13., 19., 23., 19., 5., 14., 5., 18., 7., 6., 14., 8., 20., 17., 14., 11., 16., 12., 7., 9., 23., 12., 12., 8., 7., 23., 26., 10., 9., 20., 16., 11., 4., 19., 12., 12., 5., 10., 10., 14., 10., 17., 15., 16., 11., 17., 9., 11.], [ 14., 14., 19., 11., 11., 18., 7., 16., 7., 17., 6., 19., 18., 12., 13., 13., 14., 9., 21., 16., 6., 6., 19., 14., 19., 5., 12., 14., 18., 11., 11., 21., 15., 10., 11., 14., 17., 21., 6., 14., 9., 16., 18., 12., 16., 16., 26., 16., 12., 20.], [ 13., 7., 8., 15., 13., 16., 3., 19., 11., 12., 7., 10., 13., 14., 16., 14., 23., 9., 13., 10., 11., 3., 11., 14., 9., 6., 11., 16., 18., 11., 5., 14., 10., 16., 10., 5., 14., 11., 3., 9., 11., 10., 16., 8., 13., 20., 14., 18., 21., 3.]], dtype=float32) 숙제 template 파일 제출하기 ( 윈도우의 경우 ) 1. windows + r 를누르고 cmd 입력후확인을클릭합니다. 2. 작업을수행한폴더로이동합니다. 3. 밑에명령어를 cmd 창에입력합니다. install.bat submit.bat [YOUR_HASH_KEY] 숙제 template 파일 제출하기 (MacorLinux)

1. 터미널을구동합니다. 2. 작업을수행한디렉토리로로이동합니다. 3. 밑에 bash 창을입력합니다. bash install.sh bash submit.sh [YOUR_HASH_KEY] backend.ai 서비스의업데이트에의해실행전반드시 bash install.sh 또는 install.bat 수 행을바랍니다. NextWork 고생하셨습니다. Numpy 와 Pandas 를함께해야함성공할수있는랩입니다. 아직 Matrix 와 Vector 데이터 를핸들링하는방법이익숙하지않았다면상당히어렵게푸셨을것같습니다. 그럼에도불구하고, 우리는계속 전진해야합니다. Code 가당신과함께하길 Humanknowledgebelongstotheworld - from movie 'Password' -