데이터베이스란?
데이터베이스는 데이터를 모아두는 창고이다. 더 정확히 말하면 데이터베이스는 공유 데이터(shared data), 통합 데이터(integrated data), 저장 데이터(stored data), 운영 데이터(operational data)의 집합이다.
- 공유 데이터 : 조직 내 여러 사용자들이 함께 사용하는 데이터
- 통합 데이터 : 조직 내 데이터가 여러 군데 흩어져있지 않고 한곳에 합쳐진 데이터 → 데이터 중복 최소화
- 저장 데이터 : 컴퓨터가 접근할 수 있는 매체에 저장된 데이터
- 운영 데이터 : 조직의 업무를 수행하는데 사용되어 데이터
데이터베이스의 특징
- 실시간 접근이 가능하다.
- 계속 변화한다.
- 동시 공유가 가능하다.
- 내용, 즉 값으로 참조한다.
데이터 유형
데이터베이스에 저장되는 데이터는 정형 데이터, 반정형 데이터, 비정형 데이터로 분류할 수 있다. 어떤 데이터 유형을 다룰 때 DBMS가 지원하는지 먼저 살펴봐야한다.
- 정형 데이터 : 정해진 구조에 따라 저장된 데이터이다. 엑셀의 스프레드시프, 관계 데이터베이스의 테이블에 저장된 데이터가 정형 데이터에 속한다.
- 반정형 데이터 : 정해진 구조에 따라 저장된 데이터이지만 구조를 파악하는 파싱(parsing) 과정이 필요한 데이터이다. HTML, JSON, YAML, 웹 로그 등이 반정형 데이터에 속한다.
- 비정형 데이터 : 정해진 구조 없이 저장된 데이터이다. 텍스트, 영상, 이미지 등이 비정형 데이터에 속한다.
'Computer Science > DataBase' 카테고리의 다른 글
[데이터베이스 - 6] SQL (0) | 2022.09.29 |
---|---|
[데이터베이스 - 5] 관계 데이터 모델 (0) | 2022.09.29 |
[데이터베이스 - 4] 데이터베이스 설계 (0) | 2022.09.23 |
[데이터베이스 - 3] 데이터베이스 구조 (0) | 2022.09.22 |
[데이터베이스 - 2] DBMS (0) | 2022.09.21 |