1. 데이터 표준화
데이터 표준요소에 대한 명칭, 정의, 형식 등을 수립하고 적용하는 것
2. 데이터 표준화 기대효과
- 명칭의 통일로 인한 명확한 의사소통의 증대
- 필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소
- 일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질 향상
- 정보시스템 간 데이터 인터페이스 시 데이터 변환, 정제 비용 감소
3. 데이터 표준화 원칙 수립 시 고려 사항
데이터 명칭
해당 기업 내 데이터를 유일하게 구별해주는 이름으로 유일성, 업무적 관점의 보편성, 의미 전달의 충분성 요건을 충족해야 함
- 유일성: 해당 개념을 유일하게 구분해주는 이름이어야 함
- 업무적 관점의 보편성: 업무적 관점에서 보편적으로 인지되는 이름이어야 함
- 의미 전달의 충분성: 데이터 명칭은 이름만으로 데이터의 의미 및 범위가 파악될 수 있어야 함
데이터 정의
해당 데이터가 의미하는 범위 및 자격 요건을 규정함
- 데이터 사용자가 데이터의 의미를 이해할 수 있도록 관련 업무를 모르는 제3자의 입장에서 기술
- 서술식 정의만으로 데이터의 의미 전달이 어려울 경우 실제 발생할 수 있는 데이터의 값도 같이 기술
- 데이터 명칭을 그대로 서술하거나 약어 또는 전문 용어를 이용한 정의 기술은 가급적 사용하지 않음
데이터 형식
데이터 표현 형태의 정의를 통해 입력 오류와 통제 위험을 최소화함
- 도메인을 정의하여 데이터 표준에 적용함으로써 성격이 유사한 데이터 간의 데이터 형식을 통일함
- 데이터의 최댓값 또는 최대 길이가 고정되지 않을 경우 충분히 여유 있게 정의
- 특수 데이터 타입(CLOB, Long Raw 등)은 데이터 조회, 백업, 이행 등에 있어서 제약 사항이 존재하는 경우가 많기 때문에 가급적 사용하지 않음
데이터 규칙
발생 가능한 데이터 값을 사전에 정의함으로써 데이터의 입력 오류와 통제 위험을 최소화하는 역할을 함 (정합성 및 완전성 향상)
- 기본 값
- 허용 값
- 허용 범위
4. 데이터 표준 관리 시스템 도입 시 고려 사항
- 확장성: 다양한 시스템 및 DBMS의 정보 수집과 다양한 표준관리요소(SW)들과의 표준화한 방식(API 등)으로 정보 연계관리가 가능해야 함
- 유연성: 데이터 표준을 전사적으로 일시에 적용하기는 곤란하므로 단계적 적용을 위한 여러 개의 통합 표준을 사용할 수 있는 복수 표준 관리가 가능한지와 한글명 및 영문명의 표현 방식, 표준의 변경 용이성을 검토
- 편의성: 한글명의 영문명 자동 변환, 표준 검증의 주기적인 작업 수행 기능, 메타 정보 수집 시 Import 수작업 최소화 등 사용자 편의성 검토
5. 데이터 표준 관리 대상
- 표준 용어: 용어에 대한 표준을 정의함으로써 혼란 방지 및 원활한 커뮤니케이션 촉진
- 업무적 용어: 일상 업무에서 사용하는 용어
- 기술적 용어: 정보시스템에서 사용하는 용어, DB 스키마에서 나타내는 테이블명 및 칼럼명 등
- 표준 단어: 표준 용어를 구성하는 단어에 대한 표준 정의. 용어에 대한 한글명과 영문명을 일관되게 정의할 수 있게 하며, 영문명 작성의 기준이 됨
- 표준 도메인: 칼럼에 대한 성질을 그루핑한 개념(문자형/숫자형/일자형/시간형). 동일 성질 칼럼의 타입 및 길이를 일관되게 관리하고 공통 검증 규칙 적용 가능
- 표준 코드: 도메인 값(코드 값)이 이미 정의되어 있는 도메인. 전사에 산재된 코드를 취합하여 통합 과정을 거친 전사 표준 코드를 의미
- 기타 데이터 표준 관련 요소: 주제 영역, 관계명, 데이터베이스, 데이터베이스 스키마, 테이블, 테이블스페이스, 인덱스, 제약조건 등
6. 데이터 관리자와 데이터베이스 관리자 역할 비교
| 구분 | 데이터 관리자 (DA) | 데이터베이스 관리자 (DBA) |
|---|---|---|
| 관리 대상 | 데이터 요구 사항을 반영한 데이터 모델 및 각종 표준 | 데이터 모델을 특정 데이터베이스 제품의 특성에 맞추어 구축한 데이터베이스 |
| 주업무 | 업무에 필요한 데이터의 메타 데이터를 정의하고 신규 또는 변경된 요구 사항을 신속하게 데이터 모델에 반영 | 요구되는 성능 수준을 발휘하면서 안정적으로 운영되도록 데이터베이스를 관리 |
| 품질 수준 확보 | 데이터 표준의 관리 및 적용을 통해 품질 수준 확보 | 데이터의 정합성 관리를 통해 데이터 품질 수준 확보 |
| 전문 기술 | 담당 업무 분야에 대한 업무 지식과 데이터 모델링에 대한 전문성 필요 | 데이터 모델에 대한 해독 능력 및 특정 데이터베이스 제품에 대한 전문 지식 필요 |
7. 표준화 수립 절차
- 데이터 표준화 요구사항 수집 / 표준화 현황 진단
- 표준화 원칙 수립 / 데이터 표준 정의(표준 용어, 단어, 도메인, 코드, 기타)
- 데이터 표준 검토 및 확정
- 데이터 표준 공표
- 데이터 표준 이행 / 표준 관리 절차 수립
8. 데이터 표준 검토 계획 수립
- 정확성: 데이터 표준 대상별 입력 사항이 충실히 입력되었는지 확인
- 유일성: 각 데이터 표준이 물리적으로나 의미론적으로나 유일한지 확인
- 완전성: 데이터 표준 대상별 필수 입력 사항들이 전부 정의되었는지 확인
- 범용성: 정의한 데이터 표준이 여러 정보시스템에서 적용이 가능한지 확인하고 검토 계획 수립
9. 현행 용어 분석 및 정련
- 현행 용어를 분석하여 최소 단어로 분할하고 동음이의어에 대한 정련 실시
- 한글명 및 영문명 처리는 전체적으로 검토하고 업무적인 관점에서 부담이 적은 단어를 표준 단어로 선택하게 함
10. 코드 표준화 순서
- 현행 코드 관련 자료 수집: 현행 코드 목록/값 수집, 코드성 칼럼 파악
- 코드 도메인 분류 및 중복 제거: 코드 유형별 분류, 유사성 코드 추출 및 중복 체크, 유사코드 목록 작성 및 데이터 값 표준화, 중복코드 제거
- 동일의미 코드 통합: 유사코드 목록을 토대로 표준코드명을 정한 후 분할 및 통합
- As-Is 코드와 To-Be 코드 매핑
11. 표준화 원칙 수립 관련 (합성 단어 관리)
미완성, 불만족의 접두어 ‘미’, ‘불’처럼 한자리로 구성된 단어들을 개별 단어로 관리하지 않고 합성 단어로 관리하는 방식 채택 시:
- 일관된 단어 사전의 모습을 가지지 못함
- 단어 사전의 단어 개수가 많아짐
- 사용자가 이해하기 쉽고 사용 편의성 높아짐
- 물리 DB의 허용길이 넘는 경우 발생 가능성 낮아짐
12. 데이터 표준 관리 프로세스의 역할별 담당 업무
| 역할 | 담당 업무 |
|---|---|
| 업무 담당자 | • 표준 신규 및 변경 요청 • 데이터 관리자로부터 지시받은 변경 내용 적용 |
| 데이터베이스 관리자 | • 데이터 관리자로부터 변경 표준 사항에 대한 변경 영향 파악 협조 및 평가서 작성 • 데이터 관리자로부터 지시받은 변경 내용 적용 • 테스트 및 검증 • 사용자 반영 결과 통보 |
| 데이터 관리자 | • 업무 담당자로부터 요청받은 신규 및 변경 사항 검토 및 표준 준수 여부 체크 • 변경 영향도 분석 및 보고 후 변경 계획 수립 • 준수 여부 체크 후 메타 DB에 표준 등록 • 메타 DB에 등록 완료 후 신규 및 변경 표준 배포 • 업무 담당자 및 데이터베이스 관리자에게 변경 작업 지시 후 변경 작업 수행 결과 확인 |
| 전사 데이터 관리자 | • 전사 관점에서의 표준 가이드 자문 및 제시 |
13. 지속적 표준 관리를 위한 업무 프로세스
- 데이터 표준 변경 관리 프로세스
- 데이터 표준 변경에 따른 영향도 분석 프로세스
- 데이터 표준 준수 체크 프로세스