1과목 . 빅데이터 분석기획
1) 빅데이터 분석 이해
2) 빅데이터 기술 및 제도
3) 분석 기획 과제도출
4) 분석이행 전략 수립
5) 데이터 확보와 준비
2-7.개인정보
개인정보 보호법 및 제도
- 개인정보 주체는 자연인 = 법인, 단체 정보 해당 없음.
- 성명, 주민등록번호 및 영상 등을 통하여 개인을 알아 볼수 있는 정보(개인식별정보)
- 해당 정보만으로 특정개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 정보
- 다른 정보와 쉽게 결합하여 알아 볼 수 있는 정보 - 직장명 부서 직위
- 2020년 데이터 3법 개정으로 정보주체의 동의없이도 가명처리 통해 통계작성, 연구, 공익 목적등으로 활용가능
- 개인식별 정보 : PII , 이름, 주민번호, 이메일, 전화번호 등
- 가명정보 : 일부를 가명처리하여 직접 식별은 어렵지만 추가 정보로 복원이 가능한경우 개인정보법 적용받음
- 익명정보 : 어떤 방식으로도 특정개인을 식별처리 할 수 없도록 처리한 정보 - 개인정보 보호 적용X
-- 데이터 3법 : 개인정보 보호법, 정부통신망법, 신용정보법
- GDPR : 18년 5월 EU에서 시행된 법령으로 정보 주체의 권리와 기업의 책임성 강화 등을 주요 내용하고 있는 개인정보 보호법.
데이터 3법의 대상 및 주요내용
- 개인정보보호법 : 모든 개인정보 처리자 / 개인정보 전 과정, 범용적 기본법,
- 정보통신망법 : 인터넷, 온라인 기반 정보통신서비스 제고장 / 온라인환경내 보호 + 보안 + 유출시 통지의무
- 신용정보법 : 신용정보회사, 금융회사, 여신전문금융회사, 신용조회 및 평가기관 등 / 금융,신용거래에서 발생하는 개인정보 등
2020년 데이터 3법 개정 주요내용
- 개인정보 보호위원회 독립적인 중앙 기구로 격상 =
- 가명정보를 신용정보 주체의 동의 없이 이용, 제공 가능해짐.
- 개인이 본인의 데이터를 다른 기관에 이전하도록 요구, 정보 처리 정리, 열람, 정정, 삭제 요청 가능해짐.
> 마이데이터 제도 기반 마련
마이데이터 : 정보의 주체가 자신의 개인정보를 직접 통제, 관리, 활용을 지수할 수 있는 제도
재현자료 : 재현해서 비슷하게 만들었다.
실제로 측정된 데이터를 생성하는 모형이 존재한다고 가정하고 추정된 모형에 새롭게 생성한 데이터
모집단의 통계적 특성 유지하면서 민감정보 외부에 직접공개하지 않고, 베이지안 방법이나 기계학습모형 통해 생성
임의 생성 데이터이기 때문에 개인정보 보호법으로 부터 자유로움.
개인정보 보호 원칙(개인정보보호법 33조)
개인정보처리자는 개인정보 처리 목적을 명화히하고 그 목저에 필요한 범위에서 최소한의 개인정보만 적법하고 정당하게 수집해야한다.
처리 목적 필요 범위에서 적합하게 개인정보 처리
개인정보의 정확성 , 완전성 및 최신성이 보장되도록 해야함
정부 주최의 권리가 침해 받을 가능성과 그 위험정도를 고려해야함.
열람 청구권 등 정보주체의 권리를 보장해야함
익명, 가명처리해도 목적 달성 가능하면 익명처리에 의하여 처리 : 가명정보, 익명처리에 대해서는 당사자 동의 구하지 않아도 됨
정부주최의 동의 없이 개인정보를 수집 및 이용이 가능한 경우
개인정보보호법 제15조 제1항
개인정보 수집 시 정보주체에게 고지할 내용 - 보호법 제15조 제2항 및 제17조
개인정보의 파기(개인정보 보호법 제21조)
정보주체의 동의 없이 개인정보를 수집 및 이용 가능한 경우(개인정보보호법 제15조 1항)
법을 따르기 위해서 불가피한 경우 - 세법에 따른 소득신고, 경찰의 수사목적
공공기관이 소관없무 수행 위해- 국민건강보험공단 업무, 행정업무
명백히 정보주체 또는 제3자의 급박한 생명, 신체, 재산의 이익을 위해 필요하다고 인정되는 경우
개인정보처리자의 정당한 이익을 달성하기 위해 필요한경우 - 내부감사, 서비스 개선
공공위생 등 긴급히 필요할 떄 - 감염병 대응 업무 등
진료기록부 작성 - 의료법 등 관련법령에 따라 의료인은 진료기록부를 작성, 보존할 의무 - 개인정보 동의 구하지 않아도 됨
유금 부과를 위해 회사가 사용자의 정보 조회 - 정보주체와 체결한 계약을 이행하기 위해 필요한 경우
개개인정보 보호 가이드라인
비식별화 조치 : 비식별화 조치 취한다음 수십저장조합 분석 및 제3자 제공가능
투명성 확보 : 이용자에게 투명하게 공개
개인정보 제식별 : 빅데이터 처리과정 및 생성정보에 개인정보가 재 식별될 경우 -즉시파기, 추가적인 비식별화 조치 필요
민감정보 및 통신비밀 : 개인의 건강정보, 사상 및 신념, 정치적 견해 등 - 민감 / 이메일 문자메시지-통신내용은 기본적으로 처리 금지
기기술 관리적 보호조치 : 기술적, 관리적 보호조치 적용 시행
2-8 개인정보 비식별화 기법
개인정보 비식별화 기법 개요
기법 유형
1 식별자 제거를 통한 개인정보 비식별화 기법 : 가명처리, 데이터 마스킹, 범주화, 총계처리
2 차등정보 보호기법 : 개인정보에 대해서 보호 조치 뿐만아니라 개인정보 분석도 가능함. 섭동
3 프라이버시 모델 기반 추론방지에 따른 개인정보 비식별화 기법 : K익명성, L다양성, T근접성, M유일성
가명처리 ) 다른값으로 대체한다. 휴리스틱 가명화, 암호화, 교환방법
총계처리 ) 개인정보 통계값을 적용해 개인을 특정할 수 없게 하는 기법
데이터 양이 많아야 함. 집계처리되어 정밀한 분석 어려우며, 재배열 방법의 경우 개개인의 특성 파악 힘들어
총합, 부분합, 라운딩, 재배열(개인점수-> 그룹/전체 평균)
데이터값 삭제)
식별자 :
준식별자
민감정보 : 특정 개인의 건강정보, 생체정보, 정치적 견해 등
식별자제거 통해 개인정보 비식별화 기법 - 데이터 범주화
감추기 : 명확한 값을 숨기기 위해 범주값 으로 변환 , 교수, 연구원 -> 교육계
랜덤라운딩(라운딩=반올림) :숫자 반올림할떄 사전에 정한 기준 배수의 아래 위 이웃값 중 하나로 거리(오차)에 반비례한 확률로 올림 또는 내림하는 방식 (기준배수 10, 42는 40(0.8) 또는 50(0.2)이 로~/ 46이면 40(0.4) 50은(0.6)로 반올림
제어라운딩 : 원본의 행 열의 합과 라운디 적용후 행열의 합이 동일하게 만드는 방식
범위방법 : 소득 3300만원 -> 소득 3000~ 4000만원
프라이버시 모델 기반 추론방지에 따른 갱인정보 비식별화 기법
식별자 제거 기반 비식별 처리 헀어 -> 식별자 제거를 했지만 여전히 재식별 공격 가능성 존재한다.
(연결공격 받을 수 있음) 익명처리된 데이터셋의 준식별자 정보와 외부데이터 연결해서 개인알아내는 공격
-> K 익명성 - 동일한 식별 조합 가진 레코드가 최소K개 이상
(동질성 공격, 배경지식공격)
-> L다양성 - 민간점도 다양성 확보 , 민간점보 분포상 유사할 경우 위험
(쏠림공격, 유사성공격)
->T근접성 : 민간정보 분포가 전체분포와 T이하로 근접하게 만들어 쏠림 공격 방어
->M유일성 : 비식별 처리 정보 중, 동일한 속성값 조합이 최소 M개이상 존재하게 해서 재식별어렵게
차등정보 보호 기법
개인정보에 노이즈를 추가해서 개인정보보호와 데이터 분석을 모두 진행할 수 있게 하는 방법
오차를 활용한 교란(섭동) : 원본 데이터에 무작위 오차를 더해 민감한 정보를 수집하는 기법
'레벨업 > 빅데이터분석기사' 카테고리의 다른 글
| 제주ICT이노베이션 국비과정 신청 - 빅데이터분석기사 자격증 과정 (0) | 2026.02.10 |
|---|
댓글