데이터 시각화

Similar documents
확률 및 분포

기술통계

PowerPoint 프레젠테이션

dist=dat[:,2] # 기초통계량구하기 len(speed) # 데이터의개수 np.mean(speed) # 평균 np.var(speed) # 분산 np.std(speed) # 표준편차 np.max(speed) # 최대값 np.min(speed) # 최소값 np.me


세계 비지니스 정보

[96_RE11]LMOs(......).HWP

2 ㆍ 大 韓 政 治 學 會 報 ( 第 20輯 1 號 ) 도에서는 고려 말에 주자학을 받아들인 사대부들을 중심으로 보급되기 시작하였고, 이후 조선시대에 들어와서는 국가적인 정책을 통해 민간에까지 보급되면서 주자 성리학의 심 화에 커다란 역할을 담당하였다. 1) 조선시대

UI피피티

Structure and Interpretation of Computer Programs: Assignment 3 Seung-Hoon Na October 4, George (아래 3개의 문제에 대한 구현이 모두 포함된 george.rkt파일을 제출하시오.

tkinter를 이용한 계산기 구현


untitled

COVER.HWP

이슈분석 2000 Vol.1

가볍게읽는-내지-1-2

한눈에-아세안 내지-1

kbs_thesis.hwp


*통신1802_01-도비라및목차1~11

p. 10 Before You Read p. 26 Understanding the Story ( ).,.,..,,...,...

Promise for Safe & Comfortable Driving

경제통상 내지.PS

°æÁ¦Åë»ó³»Áö.PDF

1.1 how to use jupyter notebook Esc 키를누른후 h 키를누르면누르면 jupyter notebook 의 cheat sheet 가나온다. jupyter notebook 에는 Command Mode, Edit Mode, 총두가지모드가있다. 셀을클릭

우루과이 내지-1

세계 비지니스 정보

<C1A4C3A5BFACB1B D3420C1A4BDC5C1FAC8AFC0DAC0C720C6EDB0DFC7D8BCD220B9D720C0CEBDC4B0B3BCB1C0BB20C0A7C7D120B4EBBBF3BAB020C0CEB1C720B1B3C0B020C7C1B7CEB1D7B7A520B0B3B9DF20BAB8B0EDBCAD28C7A5C1F6C0AF292E687770>

p. 8 Before You Read 4..., p. 28 Understanding the Story < >..??

07-구술총서-3-황병기-약력

π >> x=linspace(0,2*pi,30); >> y=sin(x); >> plot(x,y) π

6자료집최종(6.8))

는 우연히 안나를 알게 되고, 이후 두 사람은 서로 격렬한 사랑에 빠진다. 결국 안나가 브 론스키의 아이를 임신하게 되자, 브론스키는 안나가 카레닌과 이혼하고 자기와 함께 새로 운 생활을 하길 바라지만, 안나는 아들 때문에 망설인다. 한편, 카레닌은 브론스키를 사랑 한

야쿠르트2010 9월재출

치밀한 시간 계산으로 한 치의 오차 없이 여행일정을 계획하지만, 상황이 항상 뜻대로 돌 아가지는 않는다. 인도에서는 철로가 끊겨 있기도 하고, 미국에서는 인디언의 공격을 받 기도 한다. 하지만 그는 항상 침착하고 냉정한 태도를 유지하며, 때로는 일정에 차질이 생 겨도

8장 문자열

1

<C1DF3320BCF6BEF7B0E8C8B9BCAD2E687770>

<BCF620C3CAB5EE20342D3220B1D7B8B028326E64292DC7D0BBFDBFEB2E706466>

본문01



3장 함수


CONTENTS.HWP

INDUS-8.HWP

Willstory( ) 71.indd


LCD Display

내지무인화_

17장 클래스와 메소드

Microsoft Word _mentor_conf_output5.docx

REP - NETWORKX - 019, JULY NetworkX 를이용한 Python 그래프가시화 Graph Visualization from Python Using NetworkX 김선영 Kim SeonYeong 부산대학교컴퓨터공학과

<BFA1C0CCC5F52D3039BBEABEF7B3BBC1F E706466>

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선

쉽게 풀어쓴 C 프로그래밍

Lab - Gradient descent Copyright 2018 by Introduction [PDF 파일다운로드 ]() 이번랩은우리가강의를통해들은 Gradient descent 을활용하여 LinearRegression

<32332D322D303120B9E6BFB5BCAE20C0CCB5BFC1D6312D32302E687770>

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

*통신1510_01-도비라및목차1~12

Hi-MO 애프터케어 시스템 편 5. 오비맥주 카스 카스 후레쉬 테이블 맥주는 천연식품이다 편 처음 스타일 그대로, 부탁 케어~ Hi-MO 애프터케어 시스템 지속적인 모발 관리로 끝까지 스타일이 유지되도록 독보적이다! 근데 그거 아세요? 맥주도 인공첨가물이


<28C3D6C1BE29312DC0CCBDC2BEC62E687770>

08.8¿ù±Â¸ð´×pdf

한국전지학회 춘계학술대회 Contents 기조강연 LI GU 06 초강연 김동욱 09 안재평 10 정창훈 11 이규태 12 문준영 13 한병찬 14 최원창 15 박철호 16 안동준 17 최남순 18 김일태 19 포스터 강준섭 23 윤영준 24 도수정 25 강준희 26

REP - CP - 016, N OVEMBER 사진 요약 25 가지 색상 Surf 를 이용한 사진 요약과 사진 배치 알고리즘 Photo Summarization - Representative Photo Selection based on 25 Color Hi

00-1표지

b74...*


untitled

¹Ìµå¹Ì3Â÷Àμâ

<B9E8BAD0BAD0BEDFBAB0BFACB1B85FBEC6B5BF2EC3BBBCD2B3E228C3D6C1BE292E687770>

웹개발을위한 ComponentOne 사용법 (2) 권대건 부산대학교컴퓨터공학과 Abstract 최근웹개발이활성화되면서전문가를위한여러가지 Tool 웹애플리케이션형태로제공하는경우가늘고있다. ComponentOne 은.NET 기반의 UI C

<BCF620C3CAB5EE20362D3220B1D7B8B028326E64292DC7D0BBFDBFEB2DBCF6C1A42E706466>

23_Time-Series-Prediction

2 이달의 인물 청소년뉴스 3 [이달의 인물] EBS 장학퀴즈 우승 대아고 2학년 강찬우, 김도헌 도전하는 건 우리들의 특권, 시도하기도 전에 미리 포기하지 맙시다 혹시 장학퀴즈를 보신 적 있나요? 토요일 저녁 5시 30분, EBS 교육방송에서는 장학퀴즈가 시작됩니다.

< BCDBB3E2C5E4B7D0C8B8C0DAB7E1C1FD2E687770>

11이정민

5/12¼Ò½ÄÁö

단순 베이즈 분류기

MATLAB and Numerical Analysis

REP - networkx - 019, JULY 어 있고 Windows 계열도 지원하지만, Winodws OS의 경우 많은 버그를 가지고 있기 때문에 현재 Windows 운영 체제와 정상적으로 호환되는 패키지는 NetworkX 이다. 각 패키지의 종류와 각

정치사적

기관고유연구사업결과보고

다운로드된 lab_normal_equation.zip 파일을작업폴더로이동한후압축해제후작업하시길바랍니다. 압축해제하면폴더가 linux_mac 과 windows 로나눠져있습니다. 자신의 OS에맞는폴더로이동해서코드를수정해주시기바랍니다. linear_model.py 코드 구조

문서의 제목 나눔고딕B, 54pt

424

420

392

Microsoft PowerPoint - 기계공학실험1-1MATLAB_개요2D.pptx

3항사가 되기 위해 매일매일이 시험일인 듯 싶다. 방선객으로 와서 배에서 하루 남짓 지내며 지내며 답답함에 몸서리쳤던 내가 이제는 8개월간의 승선기간도 8시간같이 느낄 수 있을 만큼 항해사로써 체질마저 변해가는 듯해 신기하기도 하고 한편으론 내가 생각했던 목표를 향해

PowerPoint 프레젠테이션

표1

<C6EDC1FD2D30352D30302DB8F1C2F72E687770>

<C3D6C0E7C3B528BAB8B5B5C0DAB7E1292D322E687770>

ENEX PRODUCT CONTENTS Designed to resemble a nature Prime Series Standard Series Classy (White & Indigo) New Classy (White & Kha

는 마침내 걸음을 걸을 수 있게 되는 것으로 이야기는 행복하게 끝난다. 하이디를 비롯한 등장 인물들의 순수한 마음과 알프스의 때묻지 않은 자연이 그와 정반대의 환경에 노출되 어 있는 오늘날의 독자로 하여금 자연을 사랑하는 마음과 동심을 되찾게 해주는 아름다운 이야기이다

조사연구 sampling error of polling sites and the additional error which comes from non-response, early voting and second stage sampling error of voters in

영암군 관광종합개발계획 제6장 관광(단)지 개발계획 제7장 관광브랜드 강화사업 1. 월출산 기( 氣 )체험촌 조성사업 167 (바둑테마파크 기본 계획 변경) 2. 성기동 관광지 명소화 사업 마한문화공원 명소화 사업 기찬랜드 명소화 사업 240

Transcription:

데이터시각화 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 1 / 22

학습내용 matplotlib 막대그래프히스토그램선그래프산점도참고 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 2 / 22

matplotlib I 간단한막대그래프, 선그래프, 산점도등을그릴때유용 http://matplotlib.org 에서설치방법참고윈도우의경우명령프롬프트를관리자권한으로실행한후아래의코드실행 python -mpip install -U pip python -mpip install -U matplotlib 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 3 / 22

matplotlib II from matplotlib import pyplot as plt years = [1950, 1960, 1970, 1980, 1990, 2000, 2010] gdp = [300.2, 543.3, 1075.9, 2862.5, 5979.6, 10289.7, 14958.3] plt.plot(years, gdp, color = green, marker = o, linestyle = solid ) plt.title("nominal GDP") plt.ylabel("billions of $") plt.show() 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 4 / 22

matplotlib III 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 5 / 22

막대그래프 I movies = ["Annie Hall", "Ben-Hur", "Casablanca", "Gandhi", "West Side Story"] num_oscars = [5, 11, 3, 8, 10] xs = [i + 0.1 for i, _ in enumerate(movies)] # place the bar at center plt.bar(xs, num_oscars) plt.ylabel("# of Academy Awards") plt.title("my Favoriate Movies") plt.xticks([i + 0.5 for i,_ in enumerate(movies)], movies) # movie titles plt.show() 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 6 / 22

막대그래프 II 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 7 / 22

히스토그램 I from collections import Counter grades = [83,95,91,87,70,0,85,82,100,67,73,77,0] decile = lambda grade: grade // 10 * 10 histogram = Counter(decile(grade) for grade in grades) plt.bar([x - 4 for x in histogram.keys()], # shift each bar to the left by histogram.values(), # give each bar its correct heig 8) # give each bar a width of 8 plt.axis([-5, 105, 0, 5]) # x-axis from -5 to 105, # y-axis from 0 to 5 plt.xticks([10 * i for i in range(11)]) # x-axis labels at 0, 10,..., 1 plt.xlabel("decile") plt.ylabel("# of Students") plt.title("distribution of Exam 1 Grades") plt.show() 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 8 / 22

히스토그램 II 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 9 / 22

선그래프 I variance = [1,2,4,8,16,32,64,128,256] bias_squared = [256,128,64,32,16,8,4,2,1] total_error = [x + y for x, y in zip(variance, bias_squared)] xs = range(len(variance)) # we can make multiple calls to plt.plot # to show multiple series on the same chart plt.plot(xs, variance, g-, label= variance ) # green solid line plt.plot(xs, bias_squared, r-., label= bias^2 ) # red dot-dashed lin plt.plot(xs, total_error, b:, label= total error ) # blue dotted line # because we ve assigned labels to each series # we can get a legend for free # loc=9 means "top center" plt.legend(loc=9) 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 10 / 22

선그래프 II plt.xlabel("model complexity") plt.title("the Bias-Variance Tradeoff") plt.show() 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 11 / 22

선그래프 III 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 12 / 22

산점도 I 예 : 친구수와사이트에머무는시간 friends = [ 70, 65, 72, 63, 71, 64, 60, 64, 67] minutes = [175, 170, 205, 120, 220, 130, 105, 145, 190] labels = [ a, b, c, d, e, f, g, h, i ] plt.scatter(friends, minutes) # label each point for label, friend_count, minute_count in zip(labels, friends, minutes): plt.annotate(label, xy=(friend_count, minute_count), # put the label with xytext=(5, -5), # but slightly offset textcoords= offset points ) plt.title("daily Minutes vs. Number of Friends") plt.xlabel("# of friends") plt.ylabel("daily minutes spent on the site") plt.show() 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 13 / 22

산점도 II 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 14 / 22

산점도 III 축범위자동설정 ( 동일하지않음 ) test_1_grades = [ 99, 90, 85, 97, 80] test_2_grades = [100, 85, 60, 90, 70] plt.scatter(test_1_grades, test_2_grades) plt.title("axes Aren t Comparable") plt.xlabel("test 1 grade") plt.ylabel("test 2 grade") plt.show() 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 15 / 22

산점도 IV 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 16 / 22

산점도 V 축범위동일하게설정 test_1_grades = [ 99, 90, 85, 97, 80] test_2_grades = [100, 85, 60, 90, 70] plt.scatter(test_1_grades, test_2_grades) plt.title("axes Are Comparable") plt.axis("equal") plt.xlabel("test 1 grade") plt.ylabel("test 2 grade") plt.show() 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 17 / 22

산점도 VI 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 18 / 22

다중그래프 I import numpy as np import matplotlib.pyplot as plt from math import pi as pi x = np.linspace(0, 2*pi, 80) y1 = np.sin(x) y2 = np.cos(x) y3 = y1 + y2 y4 = y1 - y2 plt.figure(1) plt.subplot(221) plt.plot(x, y1) plt.title("graph 1") plt.subplot(222) plt.plot(x, y2) plt.title("graph 2") 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 19 / 22

다중그래프 II plt.subplot(223) plt.plot(x, y3) plt.title("graph 3") plt.subplot(224) plt.plot(x, y4) plt.title("graph 4") plt.show() subplot 함수의세숫자는행의수, 열의수, 그림의위치를나타냄 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 20 / 22

다중그래프 III 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 21 / 22

참고 seaborn: matplotlib 의 advanced 라이브러리 Bokeh: 웹에서많이사용되는자바스크립트라이브러리 D3.js 을파이썬에서사용할수있게함 ggplot: R 의 ggplot2 를쓸수있도록한라이브러리 박창이 ( 서울시립대학교통계학과 ) 데이터시각화 22 / 22