목차 1. 데이터품질관리필요성 2. 데이터품질관리 3. 데이터표준기반의데이터품질관리 4. 데이터표준관리체계 2

Similar documents
PowerPoint 프레젠테이션

I (34 ) 1. (10 ) 1-1. (2 ) 1-2. (1 ) 1-3. (2 ) 1-4. (2 ) 1-5. (1 ) 1-6. (2 ) 2. (8 ) 2-1. (3 ) 2-2. (5 ) 3. (3 ) 3-1. (1 ) 3-2. (2 ) 4. (6 ) 4-1. (2 )

Microsoft PowerPoint - 310_4_p28.ppt

<4D F736F F F696E74202D C55535FBBE7B7CAB9DFC7A55FB5A5C0CCC5CD20C7B0C1FAB0FCB8AEB8A620C0A7C7D120C0FCBBE720B8DEC5B8B5A5C0CCC5CD20BDC3BDBAC5DB2E707074>

( 제 20-1 호 ) '15 ( 제 20-2 호 ) ''16 '15 년국제개발협력자체평가결과 ( 안 ) 16 년국제개발협력통합평가계획 ( 안 ) 자체평가결과반영계획이행점검결과 ( 제 20-3 호 ) 자체평가결과 국제개발협력평가소위원회

< DC1A6C1D6C1BEC7D5BBE7C8B8BAB9C1F6B0FCBBE7BEF7BAB8B0EDBCADC7A5C1F62E696E6464>

PowerPoint Template

슬라이드 1

Single View of Master Data The Time of New Approach 기준정보와 표준코드 A Key to the Process Execution & Visibility 고객 만족, 업무 효율 향상, 원가 절감, 프로세스 최적화, 신속한 의사결정

5장 SQL 언어 Part II

Microsoft PowerPoint - 사본 - OAS09-사무자동화 기술(DB).ppt

슬라이드 1

Microsoft PowerPoint Python-DB

DBMS & SQL Server Installation Database Laboratory

슬라이드 1

데이터자격시험소개 한국데이터베이스진흥원은산업수요에부응하는인재양성을위해기업의데이터에관한모든구조를체계화하여설계하는능력을검정하는데이터아키텍처 (Data Architecture) 자격시험과데이터베이스개발의필수언어인 SQL(Structured Query Language) 활용능

第 1 節 組 織 11 第 1 章 檢 察 의 組 織 人 事 制 度 등 第 1 項 大 檢 察 廳 第 1 節 組 대검찰청은 대법원에 대응하여 수도인 서울에 위치 한다(검찰청법 제2조,제3조,대검찰청의 위치와 각급 검찰청의명칭및위치에관한규정 제2조). 대검찰청에 검찰총장,대

슬라이드 제목 없음

ToBeWAY MDM Suite 8.2 ToBeWAY MDM 8.2 ToBeWAY DQM 8.2 ToBeWAY DI 8.2 ToBeWAY MDM Suite 8.2 ToBeWAY MDM 8.2 ToBeWAY DQM 8.2 Pave the Way for your TO-BE

2008 Database Grand Conference 메타데이터기반데이터관리 발표 : 박시영이사 데이터스트림즈


슬라이드 제목 없음

농업정책보험금융원임직원행동강령 제정 개정 개정 개정 개정 개정 개정 제1장총칙

02-01 데이터베이스의필요성 데이터베이스의정의와특성

Microsoft PowerPoint - 10Àå.ppt

PowerPoint 프레젠테이션

Microsoft PowerPoint - 6.pptx

차세대 DB 보안 관리기술및구축사례 Fresh Start, Data Quality Initiative - 다시생각해보는데이터품질관리

Regulation on Approval of Consumer Chemical Products subject to Safety Check without promulgated Safety Standard.hwp

Microsoft PowerPoint - 3장-MS SQL Server.ppt [호환 모드]

CD 2117(121130)

InsertColumnNonNullableError(#colName) 에해당하는메시지출력 존재하지않는컬럼에값을삽입하려고할경우, InsertColumnExistenceError(#colName) 에해당하는메시지출력 실행결과가 primary key 제약에위배된다면, Ins

< FC0FCB8C15FC3D6C1BEBABB2E687770>

- JPA를사용하는경우의스프링설정파일에다음을기술한다. <bean id="entitymanagerfactory" class="org.springframework.orm.jpa.localentitymanagerfactorybean" p:persistenceunitname=

- i -

ETL_project_best_practice1.ppt

USER GUIDE

Microsoft PowerPoint - chap06-2pointer.ppt

슬라이드 제목 없음

<BBE7C8B8C0FBC0C7BBE7BCD2C5EBBFACB1B820C3D6C1BEBAB8B0EDBCAD2E687770>

WINDOW FUNCTION 의이해와활용방법 엑셈컨설팅본부 / DB 컨설팅팀정동기 개요 Window Function 이란행과행간의관계를쉽게정의할수있도록만든함수이다. 윈도우함수를활용하면복잡한 SQL 들을하나의 SQL 문장으로변경할수있으며반복적으로 ACCESS 하는비효율역

Microsoft PowerPoint - S4_통계분석시스템.ppt

활력있는경제 튼튼한재정 안정된미래 년세법개정안 기획재정부

Atlassian Solution Conference Seoul 2017

MySQL-.. 1

<4D F736F F D20B5A5C0CCC5CDBAA3C0CCBDBA20BCB3B0E8C0C720B1E2BABB20BFF8B8AE2E646F63>


<C1A62038B0AD20B0ADC0C7B3EBC6AE2E687770>

Special Theme TV SNS 2015 Spring vol

<4D F736F F F696E74202D E DB0FCB0E820BBE7BBF3BFA120C0C7C7D120B0FCB0E820B5A5C0CCC5CDBAA3C0CCBDBA20BCB3B0E8>

erwin Data Modeler r9.7소개자료

개인정보처리방침_성동청소년수련관.hwp

ISO/IEC 의온톨로지와메타데이터 표준화동향 한국과학기술정보연구원 김장원

강의 개요

PowerPoint 프레젠테이션

Chapter 5 비즈니스인텔리젼스의기초 : 데이터베이스와정보관리

자동화된 소프트웨어 정의 데이터센터

문서 템플릿

<4D F736F F F696E74202D20C0DAB7E130335FC1F6BDC4C1A4BAB8B8DEC5B8B5A5C0CCC5CD2E707074>

SQL

안전확인대상생활화학제품지정및안전 표시기준 제1조 ( 목적 ) 제2조 ( 정의 )

Microsoft PowerPoint - chap03-변수와데이터형.pptx

아이콘의 정의 본 사용자 설명서에서는 다음 아이콘을 사용합니다. 참고 참고는 발생할 수 있는 상황에 대처하는 방법을 알려 주거나 다른 기능과 함께 작동하는 방법에 대한 요령을 제공합니다. 상표 Brother 로고는 Brother Industries, Ltd.의 등록 상

농림축산식품부장관귀하 본보고서를 미생물을활용한친환경작물보호제및비료의제형화와현장적용매뉴 얼개발 ( 개발기간 : ~ ) 과제의최종보고서로제출합니다 주관연구기관명 : 고려바이오주식회사 ( 대표자 ) 김영권 (

PowerPoint Presentation

국가건설기준 설계기준 Korean Design Standard KDS : 2016 쌓기 깎기설계기준 2016 년 6 월 30 일제정

PowerPoint 프레젠테이션

진폐정도관리 - 폐기능 -

강의 개요

-. BSE ( 3 ) BSE. ㆍㆍ ( 5 ). ( 6 ) 3., ( : , Fax : , : 8 177, : 39660).. ( ). ( ),. (

무배당신한유니버설 Plus 종신보험상품요약서

KCB 정보계시스템 구축사례

Microsoft PowerPoint - QVIZMVUMWURI.pptx

UI TASK & KEY EVENT

Bind Peeking 한계에따른 Adaptive Cursor Sharing 등장 엑셈컨설팅본부 /DB 컨설팅팀김철환 Bind Peeking 의한계 SQL 이최초실행되면 3 단계의과정을거치게되는데 Parsing 단계를거쳐 Execute 하고 Fetch 의과정을통해데이터

데이터아키텍처데이터모델링 강연 (요약)

슬라이드 1

Secure Programming Lecture1 : Introduction


어린이집영상정보처리기기 설치 운영가이드라인 보건복지부 - 1 -

PowerPoint Presentation

View Licenses and Services (customer)

쉽게 풀어쓴 C 프로그래밊

120330(00)(1~4).indd

ERwin 3rd Product

untitled

목 차

<312E20C0AFC0CFC4B3B5E55F C0FCC0DAB1E2C6C720B1B8B8C5BBE7BEE7BCAD2E687770>

암호내지

슬라이드 1

슬라이드 제목 없음

2016 년도종합청렴도 1 등급 달성하자! 전사적자원관리시스템 (ERP) 성과감사결과보고 전사적자원관리시스템 (ERP) 사용자편의성및효율성점검 감사실

<4D F736F F F696E74202D20322EB1E2BEF7C0C7C7D9BDC9B5A5C0CCC5CDB0FCB8AEC8BFC0B2C8ADB9E6BEC82D4D444D5FB9DFC7A5BFEB5F76322E305F E707074>

@OneToOne(cascade = = "addr_id") private Addr addr; public Emp(String ename, Addr addr) { this.ename = ename; this.a

- I - - II -

경상북도와시 군간인사교류활성화방안


DW/BI 시스템등장배경 v 과거 Computer 의역할은업무처리를지원하는프로세스개선과시간절감의가치를지녔으나이후데이터의축적으로정보활용측면의가치가새롭게부각되면서정보분석관점의새로운아키텍처가개발됨 고객 / 영업사원 서비스 세일즈 마케팅 처리계 정보분석 정보현황 경영정보 사내


대한주택보증 ( 주 ) 대한주택보증

Transcription:

데이터표준기반의 데이터품질관리 2011.10

목차 1. 데이터품질관리필요성 2. 데이터품질관리 3. 데이터표준기반의데이터품질관리 4. 데이터표준관리체계 2

저품질데이터피해사례 1. 데이터품질관리필요성 피해사례 1 개인연금가입자의정보오류 30 만 9,825 건, 보험료징수오류는 690 억원 (09 년한국일보 ) 피해사례 2 데이터오류로인해과세를할수없고마케팅손실비용을감당해야하는등피해사례속출 (08 년전자신문 ) 피해사례 3 사회복지통합망개통 ( 10.1) 후데이터오류 (20 만건 ) 로서비스제공지연초래 피해사례 4 08 년 6 만 7 천여명의주민 - 호적간자료불일치정비작업에 17 억원소요 3

필요성 1. 데이터품질관리필요성 4

동향 1. 데이터품질관리필요성 행정정보데이터베이스표준화지침 행정안전부고시제 2008-47 호 ( 제정 2008-11-25) 행정및공공기관이행정정보데이터베이스를구축, 운영, 폐기및품질관리를하는경우준수하여야할절차및산출물을규정 제 7 장행정 DB 의품질관리 (28 조 ~31 조 ) 행정안전부 공공기관의데이터관리지침개발 법제도개선을통해의무화 특허청데이터품질관리규정 특허청훈령제 643 호 ( 제정 2009-11-13) 특허청데이터품질관리에관한사항을규정함으로써특허행정의신뢰성증진과고객만족도향상에이바지함을목적 총 5 장 21 조와부칙으로구성 서울시데이터품질관리지침 데이터품질관리지침마련 (2009 년 ) 데이터관리지침, 데이터품질관리지침, 데이터보안관리지침, 데이터표준화지침으로구성 공공기관 DB품질확보 한국데이터베이스진흥원 데이터베이스품질인증제도운영지침 ( 문화체육관광부고시제 2010-33 호 ) 데이터베이스품질인증기관지정 ( 문화체육관광부고시제 2010-39 호 ) 5

데이터관리구성요소 2. 데이터품질관리방법 6

데이터품질관리절차 2. 데이터품질관리방법 데이터품질관리 ( 식스시그마방법론 ) 의각단계별활동 정의 측정 분석 개선 통제 품질관리대상과지표를정의하고, 업무규칙을정의한다. 측정환경및측정계획을수립하고, 품질측정후측정결과를보고한다. 오류추정데이터에대한현상을분석한다. 오류데이터의개선을위해캠페인, 클린징, 시스템로직개선, 표준화등의개선활동을수행한다. 활동을수행한다. 다. 품질이슈관리 / 성과평가 / 지침및업무기준의제ㆍ개정 / 정기적감사활동을수행한다. 대상선정 품질측정환경준비 원인분석요청 대상선정 품질개선평가 기준정보정의 측정계획수립 원인분석계획수립 개선방안수립 품질목표관리 DQI 정의 품질측정 원인분석 정제및개선 품질지침관리 CTQ 정의 품질측정결과보고 품질관리감사 업무규칙정의 이슈관리 7

업무규칙의 정의 2.데이터품질 관리 방법 데이터품질 진단은 데이터에 대한 기술적 접근과 업무적 접근 방법으로 업무규칙을 정의하여 데이터 를 검증 기술적 접근에 의한 정의 (Inside - Out) 업무적 요구사항에 의한 정의 (Outside - In) Profiling&Auditing 분석 자료 업무적 관점 분석 요구사항 분석 변환 100.00% 99.00% 98.00% 97.00% 96.00% 업무규칙 정의 데이터 이슈 조 사 도출 95.00% 94.00% 93.00% 92.00% 91.00% 90.00% 1차 2차 3차 4차 업무규칙 설계 데이터 분석으로부터 시작(프로파일링 결과 활용) 데이터 구조나 허용 값, 다른 데이터와의 관계 등의 정보를 파악하기 위해 메타 데이터 활용 업무 관점의 이슈나 현업 담당자의 인터뷰 등을 통해 업무 수행에 핵심이 되는 요건으로부터 시작 추출된 부정확한 데이터에서도 검증규칙 도출 가능 재 작업, 고객 불만 등의 핵심 업무 프로세스 로부터 업무규칙 도출 8

데이터품질지표 2. 데이터품질관리방법 데이터품질지표를적용하여관리 대분류소분류지표내용 완전성 유효성 단독완전성조건완전성범위유효성날짜유효성형식유효성코드유효성 컬럼값이항상존재 (Not Null) 조건에따라컬럼값이항상존재 (Not Null) 컬럼값이유효값목록에존재하여야하거나유효범위내에존재하여야한다컬럼정의가날짜일때값은유효한날짜값을가져야한다정해진포맷에맞게값이존재하여야한다컬럼값이단일코드또는통합코드내에정의된값을가져야한다 유일성유일성 PK, UK, 업무적으로유일해야하는데이터는 1 건만존재하여야한다 최신성최신성마스터테이블의데이터는이력데이터의최근데이터와동일하여야한다 일관성 참조무결성테이블간일관성컬럼간일관성레코드간일관성데이터흐름일관성 모델링단계에서설계된테이블과테이블간의참조무결성이 DBMS 에서도일관되게유지되어야한다 테이블간의컬럼값이업무규칙을준수해야한다 동일테이블또는 2 개이상의테이블간의 column 값이서로모순되지않아야한다 동일테이블에 2 개이상의 Row 간의값이일관성 데이터를생성하거나가공하여시스템간데이터가이동되는경우데이터누락여부, 오류로잘못생성, 가공된데이터나중복생성된데이터가있는지를평가 9

데이터품질관리의시작 2. 데이터품질관리방법 데이터품질관리는데이터식별부터시작 ü 어떤데이터인가? ü 문제데이터의관련항목은어떤것들이있는가? ü 어떤데이터가정확한데이터인가? ü 오류데이터를어떻게발견하고조치할수있는가? ü 지속적인데이터품질관리를위해서어떻게해야하는가? 10

메타데이터란? 3. 데이터표준기반의데이터품질관리 메타데이터의이해? 데이터의사용성과관리효율성을향상시키기위해필요한데이터에관한데이터를메타데이터 (Metadata) 라하며이러한메타데이터를통합관리하는시스템을메타데이터관리시스템이라함. Customer Table 데이터의구조 Metadata CUST_NO CUST_NAME SEX CUST_ADDRESS CUST_COMMI ACT_OPEN_DATE 4321888 홍길동 F 경기도고양시 A 아파트 500,000,000 원 30/11/05 Data 1234567 이하늘 M 경기도안양시범계동 56 30,000,000 원 12/11/04 업무수행과관련된모든데이터예 ) 고객번호, 계약번호, 청구일자, 청구금액등 3456900 김한국 F 서울시여의도동도화동 1,000,000,000 원 11/12/03 Master Data 자주동일한의미로, 시간의흐름에따라변하지않는업무수행을위한기반데이터예 ) 인사마스터 : 군번, 고객명, 성별, 생년월일등조직마스터 : 조직코드, 조직명, 상위조직코드등 Code 전체업무프로세스에서사용되는코드성데이터예 ) 장비구분, 성별코드, 직위코드등 11

민주명성 별성령연 혼기념결일편번호우 ( 자 ) 화번호전 ( 자 ) 맹가맹점명가 종업급등 수료율수불방법지 불주기지 민주명성 별성령연 혼기념결일편번호우 ( 자 ) 화번호전 ( 자 ) 맹가맹점명가 종업급등 수료율수불방법지 불주기지 출매드카 민주맹가 인승수영업접소 품구분상 인승인승 인승드번호카 맹점번가호부개월할 동자 출매드카 민주맹가 인승수영업접소 품구분상 인승인승 인승드번호카 맹점번가호부개월할 동자 동/ 수 동/ 수 드카민번호주 드구분카원등급회 치영업유소제일결 제구분결 구청월금 / 입 드카금반영입일 품구분상정상청구원금 연체청구원금미도래입금원금 드카민번호주 드구분카원등급회 치영업유소제일결 제구분결 구청월금 / 입 드카금반영입일 품구분상정상청구원금 연체청구원금미도래입금원금 민주명성 별성령연 혼기념결일편번호우 ( 자 ) 화번호전 ( 자 ) 맹가맹점명가 종업급등 수료율수불방법지 불주기지 민주명성 별성령연 혼기념결일편번호우 ( 자 ) 화번호전 ( 자 ) 맹가맹점명가 종업급등 수료율수불방법지 불주기지 출매드카 민주맹가 인승수영업접소 품구분상 인승인승 인승드번호카 맹점번가호부개월할 동자 출매드카 민주맹가 인승수영업접소 품구분상 인승인승 인승드번호카 맹점번가호부개월할 동자 동/ 수 동/ 수 드카민번호주 드구분카원등급회 치영업유소제일결 제구분결 구청월금 / 입 드카금반영입일 품구분상정상청구원금 연체청구원금미도래입금원금 드카민번호주 드구분카원등급회 치영업유소제일결 제구분결 구청월금 / 입 드카금반영입일 품구분상정상청구원금 연체청구원금미도래입금원금 데이터표준화란? 3. 데이터표준기반의데이터품질관리 DATA 표준화? 데이터표준화란데이터요소의생성에규칙을적용하여데이터의품질을향상시키는계속적인활동이다. 데이터표준화원칙과표준관리체계를수립하고, 반복적인표준화활동을통해데이터표준을생성 검증 통제하는일련의프로세스이다. AS-IS TO-BE 데이터베이스 연구마루 통합성과관리 성과누리 표준데이터 데이터관리표준 데이터아키텍처원칙 12

데이터표준의정의 3. 데이터표준기반의데이터품질관리 13

표준데이터구성요소 3. 데이터표준기반의데이터품질관리 표준용어표준단어표준도메인표준항목 표준단어 + 복합어 + 유사어 분리하여자립적으로쓸수있는최소한의말 유사한유형의데이터를그룹화하여공통데이터의유형과길이를정의한것 표준단어 + ( 표준단어 ) +..+ 도메인 VAT 납입일 부가가치세납부일자 부가가치세납부일자 부가가치세납부일자 VAT_PAY_DT ( 애트리뷰트 ) ( 컬럼 ) 14

도메인정의 3. 데이터표준기반의데이터품질관리 도메인관련항목허용값 번호 주민번호, 계좌번호, 고객번호접수번호 * 주민번호형식 : 999999-9999999 ( 숫자 6 자리 - 숫자 7 자리구성 ) 율, 금액, 수량 대출이자율, 진척율감가상각금, 수수료, 거래횟수 대출이자율최소값 : 0 최대값 : 49 명칭 상호명, 고객명, 논문한글제목, 논문영문제목 논문한글제목 : 필수입력항목논문영문제목 : 필수입력항목 날짜 접수일자, 거래일시 ( 년월, 년월일, 년월일시분초 ) 일자형식 : Y Y Y Y -MM-DD 일시형식 : Y Y Y Y MMDDHH24MISS 내용 상품설명, 반려사유 ( 설명, 비고, 사유 ) 반려사유 : 검토결과반려시필수입력항목 분류, 코드 계정코드, 상품코드, 계약상태코드 15 계약상태코드코드종류 : 공통코드코드 ID : C0014

도메인기반의데이터품질진단 3. 데이터표준기반의데이터품질관리 품질지표 완전성 관련항목 고객주민번호 진단방법 주민번호는숫자 6 자리 - 숫자 7 자리구성 조건완전성 대출이자율 대출이자율은법정최고이율은 49% 이므로 0~ 49 사이의값을가져야함 범위유효성 논문영문제목 제목은반드시입력되어야한다. 영문명은알파벳으로입력되어야한다. 날짜유효성 접수일자 거래일시는 Y Y Y Y -MM-DD HH:MM:SS 로구성되어야한다. 형식유효성 반려사유 기안반려시반려사유는반드시입력되어야한다. 코드유효성 계약상태코드 계약상태코드는공통코드테이블의코드 ID C0014 의코드값중에하나를가져야한다. 16

절차 ( 프로세스 ) 4. 데이터표준관리체계 17

조직 / 역할 / 책임 (1) 3. 데이터표준화소개 데이터관리를위한명확한역할및책임을정의 모델러 데이터구조관리 데이터아키텍트 데이터구조생성통제하는사전데이터관리 데이터모델설계 데이터요구사항관리 데이터표준적용 데이터모델통합관리 데이터사용자 비표준 /DB GAP 개선 데이터표준관리 데이터관리위원회 데이터요구사항요청 데이터관리에대한 데이터생성의주체 전략적의사결정을 데이터품질이슈제기 데이터오너 데이터품질관리자 하는최고의사결정기구 데이터발생후오류를발견하여조치하는사후데이터관리 데이터품질이슈관리 품질관리활동에대한 데이터품질관리책임자전반적인관리 데이터품질개선의주체 - 대상, 업무규칙평가 - 측정결과평가 데이터품질관리 18

조직 / 역할 / 책임 (2) 4. 데이터표준관리체계 19

데이터표준의활용 4. 데이터표준관리체계 데이터표준정의데이터구조설계데이터베이스구현 데이터표준적용 DB 반영통제 표준단어 논리모델 주제영역 물리모델 개발계 도메인 엔티티 테이블 테스트계 표준항목 어트리뷰트 컬럼 운영계 표준준수여부검증 설계 vs 구현 GAP 분석 20

통합데이터관리시스템 4. 데이터표준관리체계 데이터베이스 품질관리대상 데이터품질관리시스템 품질지표 업무규칙 품질현황품질추이 DB #1 오류데이터측정 / 개선 측정결과 데이터흐름 오류데이터 개선활동내역 결과분석 개선평가 품질현황품질추이 경영층 DB #2 DB #3 데이터구조관리 표준데이터 데이터베이스정보 데이터흐름 메타데이터관리시스템 데이터모델 ETL 메타정보 영향도분석 As-Is 현행모델정보 BI 정보 관리정보 표준정보모델 /APP 정보 표준준수도데이터의미 데이터품질관리자 DA 영향도분석 형상관리 OLAP/ 레포팅 ETL ETCL 프로세스 매핑...... 모델링도구 IT 사용자 App 개발 보고서개발 ETLJOB 개발 모델링 현업사용자 APP 개발자 OLAP 개발자 ETL 개발자모델러 21

위세아이텍 / DM 사업부 최용준부장 cyj337@wise.co.kr 22