데이터베이스개념
태그 :
- 개념
- 한 조직의 여러 응용시스템이 공용(shared)하기 위해 최소의 중복으로 통합(integrated), 저장(Stored)된 운영(Operational) 데이터의 집합으로 통합된 데이터, 저장된 데이터, 운영데이터, 공용데이터로 구성됨
분류 |
내용 |
통합 데이타 (integrated data) |
동일한 데이터가 원칙적으로 중복되어 있지 않다는 것을 의미 -최소의 중복(minimal redundancy) -통제된 중복(controlled redundancy) |
저장 데이타 (stored data) |
컴퓨터가 접근 가능한 저장 매체에 저장 (테이프, 디스크 등) |
운영 데이타 (operational data) |
한 조직의 고유 기능을 수행하기 위해 필요한 데이터 (단순한 입출력 등 작업처리과정의 임시 데이터는 운영데이터가 아님) |
공용 데이타 (shared data) |
한 조직의 여러 응용 프로그램이 공동으로 소유, 유지, 이용하는 데이타 |
1. 파일 시스템 문제점 및 데이터베이스 시스템 장단점
가. 파일 시스템의 문제점
- 데이터 독립성 보장 미흡 – 프로그램 의존적
- 데이터 일관성 보장 문제 – 파일의 시간 의존성(걷어낼 시점별 다른 값)
- 데이터 무결성 보장 문제 – 의미적으로 같은 값은 동일하게 유지되어야 함
- 공유성, 사용 편의성 저조 - 낮은 경제성, 보안관리 저조
나. 데이터베이스 시스템의 장단점
장점 |
단점 |
자료 독립성 중복자료 감소 자료 통합 처리 자체 자료관리 기능 (병행제어/회복/무결성/보안) 생산성 향상 (표준화 도구 / 개발기간단축 / 유지보수 비용 절감) |
시스템 부담증가로 인한 저효율 시스템 복잡함 복잡한 연산 위한 고급 인력 필요 어려운 백업 및 회복 높은 비용 및 고급인력필요 |
다. 종이에 기록하는 전통적인 방법에 비한 장점
장점 |
내용 |
압축성 |
많은 양의 종이 파일이 필요 없음 |
처리 속도 |
기계는 인간보다 훨씬 빨리 데이터를 검색하고 변환 시킬 수 있음 |
단조롭게 고된 일 감소 |
수작업에 의해서 파일을 유지하는 고된 일이 제거 |
현재성 |
정확한 최신의 정보가 항상 이용가능 |
라. 중앙집중 제어를 갖는 데이터베이스 장점
장점 |
내용 |
중복성 감소 (Redundancy) |
개별적 파일이 갖는 중복성을 데이터베이스를 통해 감소시켜 기억장소 감소와 전반적 통제권강화의 효과를 가져올 수 있음 |
불일치 피함 (Inconsistency) |
두 개(N개)의 파일에 수정이 필요할 때 한 개만 수정하고 나머지 한 개는 수정이 안되어 불일치가 발생할 수 있는데 데이터베이스를 이용할 경우 한번에 일관성 있는 수정이 가능하게 됨 |
데이터공유 (Shared) |
응용 프로그램이 처리하기 위한 데이터가 서로 공유되어 제공받을 수 있는 환경 제공 |
표준화 (Standard) |
데이터베이스를 중앙에 통제함으로써 데이터를 표현하는 데 모든 적용가능한 표준을 확립할 수 있음 |
보안 (Security) |
데이터에 대한 완전한 권한을 가짐으로써 데이터베이스를 적절한 채널을 통해서만 접근 가능하도록 할 수 있음 |
무결성 (Integfity) |
데이터베이스에 데이터가 정확하다는 것을 보증하는 것 데이터베이스 중앙통제를 통해 무결성 통제를 한층 더 쉽게 할 수 있음 |
2. 데이터베이스 시스템의 일반적인 특징
구분 |
내용 |
실시간 접근성 (real-time accessibilities) |
수시적이고 비정형적인 질의(query)에 대하여 실시간 응답 |
계속적인 변화 (real-time accessibilities) |
갱신, 삽입, 삭제 : 동적 특성 (이러한 변화 속에서 항상 현재의 상태(state)를 정확히 유지) |
동시 공용 (concurrent Sharing) |
동일 데이터를 여러 사람이 다른 방법으로 동시(concurrent) 에 공용할 수 있도록 지원 |
내용에 의한 참조 (content reference) |
위치나 주소가 아닌, 사용자가 요구하는 데이터의 내용(data contents), 즉 값(value)에 따라 참조 |
- 1970년 이전, 파일 시스템 사용으로 데이터 중복에 따른 일관성 문제 대두
- 데이터 일관성 문제를 해결하기 위해 1970년 E.F Codd에 의한 정규화 이론 발표
- 정규화 이론에 입각하여 데이터 중복성을 최소화한 데이터베이스 확산
- 1975년, 데이터를 모델링하여 체계화된 방법에 의한 스키마 구성
- 1980년 이후, ANSI에 의해 SQL표준화에 따라 관계형 DBMS의 확산 적용
- 디지털 자료의 급격한 증가에 따른 데이터분석 중요성은 증가하였으나 성능저하 발생.
이에 따라 데이터 일관성과 함께 대량데이터 처리를 위한 데이터 처리성능 중요성 부각 - OLTP 에 최적화된 Row-based 기반의 RDB와 OLAP에 최적화된 Column-based 기반의 RDB로 발전이 가속화됨
|
|
|
-최소의 중복(minimal redundancy) -통제된 중복(controlled redundancy) |
(stored data) |
컴퓨터가 접근 가능한 저장 매체에 저장 (테이프, 디스크 등) |
(operational data) |
(단순한 입출력 등 작업처리과정의 임시 데이터는 운영데이터가 아님) |
(shared data) |
|