빅데이터분석준전문가자격증
ADsP. PART.3 - 데이터 분석 - 통계분석 - 정형 데이터 마이닝
theblack0
2022. 7. 4. 12:09
반응형
데이터마이닝
- 기업이 보유하고 있는 일일 거래 데이터, 고객 데이터, 상품 데이터 혹은 마케팅 활동에 있어서의 고객 반응 데이터 등과 이외의 외부 데이터를 포함하는 모든 사용가능한 원천 데이터를 기반으로 감춰진 지식, 기대하지 못했던 경향 또는 새로운 규칙등을 발견하고 이를 실제 비즈니스 의사결정 등에 유용한 정보로 활용하는 일련의 작업
데이터마이닝 5단계
목적정의
- 데이터 마이닝 도입 목적을 명확하게 함
데이터 준비
- 데이터 정제(Cleaning)를 통해 데이터의 품질 확보까지 포함
- 필요시 데이터 양 충분하게 확보
데이터 가공
- 목적변수를 정의하고, 필요한 데이터를 데이터 마이닝 소프트웨어에 적용할 수 있게 가공 및 준비하는 단계
- 충분한 CPU와 메모리, 디스크 공간 등 개발환경 구축이 선행
데이터 마이닝 기법 적용
- 모델을 목적에 맞게 선택하고 소프트웨어를 사용하는 데 필요한 값 지정
검증
- 결괴에 대한 검증 시행
*********************대표적 데이터 마이닝 기법*****************************************
분류분석(Classification Analysis)
- 새롭게 나타난 현상을 검토하여 기존의 분류, 정의된 집합에 배정하는 것
- 의사결정나무, momory-based,resoning 등
추정분석(Estimation Analysis)
- 주어진 입력 데이터를 사용하여 알려지지 않은 결과의 값을 추정하는 것
- 연속된 변수의 값을 추정, 신경망 모형
연관분석(Association Analysis)
- '같이 팔리는 물건' 같이 아이템의 연관성을 파악하는 분석
- 카탈로그 배열 및 교차판매, 공격적 판촉행사 등의 마케팅 기획
예측분석(Predication Analysis)
- 미래에 대한 것을 예측,추정하는 것을 제외하면 분류나 추정과 동일한 의미
- 장바구니 분석,의사결정나무,신경망모형
군집분석(Clustering Analysis)
- 미리 정의된 기준이나 예시에 의해서가 아닌 레코드 자체가 가진 다른 레코드와의 유사성에 의해 그룹화되고 이질성에 의해 세분화됨
- 데이터 마이닝이나 모델링의 준비단계로서 사용됨
기술분석(Description Analysis)
- 데이터가 가진 특징 및 의미를 단순하게 설명하는 것
- 데이터가 암시하는 바에 대해 설명 및 그에 대한 답을 찾아낼 수 있어야함
반응형