레벨업/데이터준관리자

[데이터분석준전문가(ADsP)] #3. 1과목 데이터 이해

우와우앙 2023. 9. 18.
728x90
반응형

<데이터의 정의>

 - 데이터는 객관적인 사실(fact)

 - 다른 객체와의 상호 관계에서 가치를 갖음.

 - 데이터의 유형 :

 > 정성적 데이터(언어, 문자)

 > 정량적 데이터(수치, 기호, 도형) 

 

<암묵지/형식지> 

 - 암묵지 : 무형의 지식

 - 형식지 :  형식화 된 지

 - 지식경영 : 암묵지와 형식지의 상호작용으로 생성, 발전, 전환되는 지식의 발전을 기반으로 하는 기업경영

 * 공통화/→ 표출화/외재화 →연결화내면화/내재화 

 

<데이터베이스의 정의>

1) 정형데이터를 저장하는 장치/행과 열이 존재하는 자료들(텍스트, 숫자 등)

2) 비정형데이터도 저장하는 장치 

3) 정보를 저장하는 지식베이스 진화

4) 원하는 정보 저장 검색할 수 있는 복합체로 진화

 

특징 : 통합 , 저장, 공용, 변화되는 데이터

 - 통합데이터 : 데이터가 중복되는 것을 배제하고 한군데 모았다. 

 - 저장 데이터 : 컴퓨터가 접근할 수 있는 저장매체에 저장된다.

 - 고용 데이터 : 여러 사용자에게 데이터를 공동으로 이용되는 것

 - 변환되는 데이터  : 추가, 삭제, 갱신으로 항상변화하면서도 항상 현재 정확한 데이터를 유지해야함(=무결성) 

 

<데이터베이스 용어>

데이터베이스의  table,

  - 단일 주제에 대한 행(가로,row)과 열(세로,column)로 구성된 정보의 집합

 - 관계형 데이터베이스 ; 행-튜플(tuple), 열-속성(atrribute), 테이블-릴레이션(relation) 부름

 - 도메인 : 하나의 속성이 취할 수 있는 같은 타입의 원자 값들의 집합

- 카디날리티 : 릴레이션 튜플의 개수 = 헹

 

- DD : DATA Dictionary 자료 사전

- ERD : entity realtionship diagram : 실체와 이들의 관계를 도형으로 표현

- SQL : structured query language : 데이터베이스와 통신을 위해 고안된 언어/ RDBMS 데이터를 관리하기 위한 언

 

대응관계

1:1 / 하나의 개체가 하나의 개체에 대응

1:N / 하나의 개체가 여러 개체에 대응

N:1 /여러개체가 하나의 개체 대응

N:M / 여러개체가 여러개체에 대

 

 - SQL 명령어 분류 / 모르는 분야 공부필요.

 > DDL : CREAT, ALTER, DROP, RENAME, TRUNCATE / 데이터베이스 테이블 구조 생성, 수정, 제거

  - DML : SELECT, INSERT, UPDATE, DELETE / 데이터베이스내 데이터 넣는 작업 등

  - SELECT : SELECT 칼럼, FROM 테이블, WHERE 조건식, GROUP BY 그룹화할 컬럼, HAVING 조건식, ORDER BY정렬 컬

 

> DCL : GRANT, REVOKE, 데이터베이스 접근권한 부여 및 회수

>TCL : COMMIT, ROLLBACK, SAVEPOINT, DML로 실행한 변경사항 저장관리하는 명령

 

-메타데이터★

 : 데이터에 관한 데이터, 데이터 설명해주는 데이터 / 데이터에 대한 구조화된 데이터, 원시데이터

-인덱스 : DB에서 테이블에 대한 동작 속도 높여주는 자료 구조. 

 

<DBMS> 

 -DBMS : 사용자와 데이터베이스 사이에서 사용자 요구에따라 정보처리 및 데이터베이스 관리해주는 소프트웨어

 > RDBMS :관계형 데이터베이스 관리 시스템 / 정형화된 테이블로 구성된 데이터 항목들의 집합체,MySQL, Oracle database, SQL

 > ODBMS : 객체 지향 데이터베이스 관리 시스템 / 객체들을 생성하여 계층에서 쳬적으로 정리하고, 다시 계층들을 하위 계층이 상위계층으로부터 속상을 물려받는 DBMS / 복잡한 데이터 구조를 표현 및 관리하는 DMBS

 

<시대별 기업 내부 데이터베이스 솔루션>

 - 1980년대 : OLTP, OLAP

>OLTP : Online Transaction Processing, 온라인 거래 처리

>OLAP : Online analytical processing, 온라인 분석 처리, 다차원으로 이루어진 데이터로부터 통계적인 요약 정보를 제공할 수 있는 기술, 다차원의 데이터를 대화식으로 분석하기 위한sw

 

- 2000년대 : CRM, SCM  

CRM : 고객 관계 관리 

SCM : 공급만 관리 

 - 유통공급망에 참여하는 모든 업체들이 협력바탕으로 정보기술을 활용, 재고 최적화 

 - 시간과 비용을 최적화 시키기 위한 것

 

<분야별 데이터베이스 솔루션> - *제조부문

 

데이터웨어하우스(의사결정 지원 애플리케이션을 위한  하나의 통합된 데이터 저장공간/ ETL) 

특징 : 데이터 통합(전사적 차원에서 일관된 형식 정의), 데이터 시계열성(시간의 흐름에 따라 변화값 저장), 주제 지향적, 비소멸성(특정 주제에따라 데이터 분류, 저장, 관리)

 

데이터마트 : 전사적으로 구축된 데이터웨어하우스로부터 주제, 부서 중심드로 구축된 소규모 단일 주제 데이터하우스임.

ERP : 생산, 구매, 재고, 공급자와의 거래 등 주요 프로세스 관리를 돕는 여러 모듈로 구성된 통합 애플리케이션 소프트웨어 패키지.

 

BI : 데이터를 통합 분석하여 기업 활동에 연관된 의사결정을 돕는 프로세스를 말함, 가트너는 사용자가 필요로 하는 정확한 시간에 제공할 수 있는 환경으로 정의. 하나의 특정 질문에 답변하도록 설계

 

BA : 경영 의사결정을 위한 통계적이고 수학적인 분석에 초점. 

 

ad hoc report :  BI와 빅데이터 분석의 차이점을 표현한 키워드, 일회용 작성된 임시 보고서를 말 함.

 

<분야별 데이터베이스 솔루션> - *금융부문

 - 볼록체인 : 참여자 모든 사람에게 거래내용을 보내주어 대조하는 데이터 위조방지 기술

 

<분야별 데이터베이스 솔루션> - *유통부문

 - KMS : 지식관리 시스템

 - RFID : 무선주파수를 이용하여 대상을 식별하는 기술

 

<빅데이터>

4V : volume(크기), variey(다양성), velocity(속도), value(가치, 비즈니스 효과요소)

 

<빅데이터 출현 배경>

 양질 전환 법칙

 

<IoT, internrt of things

728x90
반응형

댓글