빅데이터분석준전문가자격증

ADsP. 자주 출제되는 주관식 문제 - PART.1 - 데이터 이해

theblack0 2022. 7. 4. 12:43
반응형

1.데이터 이해

"A마트의 다른 상품들도 B마트보다 쌀것이라 판단" 지혜
데이터 사이언티스트가 갖춰야 할 역량은 빅데이터의 처리 및 분석에 필요한 이론적 지식과 기술적 숙련에 관련된 능력인 (ㄱ) skil과 데이터 속에 숨겨진 가치를 발견하고 새로운 발전 기회를 만들어 내기 위한 능력인 (ㄴ)skil로 나누어진다 (ㄱ) : Hard 
(ㄴ) :Soft
(ㄱ)는 데이터 가공 및 상관관계 간 이해를 통해 패턴을 인식하고 그 의미를 부여한 것이며 지식을 도출하기 위한 자료 (ㄱ) : 정보
기업의 의사결정 과정을 지원하기 위한 주체 중심적으로 통합적이며 시간성을 가지는 비휘발성 데이터의 집합을 (ㄱ)이라고 한다 (ㄱ) : 데이터웨어하우스
지난 몇년간 여러 사일로 대신 하나의 데이터 소스를 추구하는 경향이 생겼다. 전사적으로 쉽게 인사이트를 공유하는 데 도움이 되기 때문이다. 다시 말해 별도로 정제되지  않은 자연스러운 상태의 아주 큰 데이터 세트인(ㄱ)을 기업들이 구현하는 것은 2017년 새롭게 등장한 트랜드가 아니다. 그러나 2017년은 이를 적절히 관리해 운영하는  첫 해가 될 전망이다. (ㄱ) : 데이터 레이크
형태와 형식이 전해져 았지 않고 언어 또는 문자로 기술되는 데이터 정성적 데이터
기가바이트 < 데라바이트 < (ㄱ) < 엑사바이트 (ㄱ) : 페타바이트(PB)
(ㄱ)은 공장 내 설비와 기계 사물 인터넷(IoT)이 설치되어 공정 데이터가 실시간으로 수집되고 데이터 기반한 의사결정이 일어짐으로써 생산성을 극대화 할 수 있는 기술 스마트팩토리
1Gbps는 1초에 대략 1GB의 데이터를 전달할 수 있는 속도를 나타낸다. 1Gbps의 속도를 제공하는 통신망을 통해 1PB 크기의 데이터를 전송하는 데 걸리는 시간은 대략 얼마의 초단위로 나오는 지 적으시오 1TB = 1024GB
1PB = 1024TB
1,024*1,024 = 1,048,576
다양한 ICT기술과 금융서비스의 결합은 새로운 금융분야의 변화로 나타나고 있으며, 그에 따른 정보보안이 더욱 중요하게 부각되고 있다. 초기 모바일 결제, 송금영역에서 시작하여 다양한 분야로 확대되고 있으며, 최근에는 빅데이터와 접목하려는 시도들이 잇따르고 있어 더욱 확장성이 기대됙도 한다. 이를 지칭하는 금융과 기술의 합성어 금융기술(FinTech)
이것은 데이터베이스의 구조와 제약조건에 관한 전반적인 명세를 의미하는 것으로서, 데이터베이스를 구성하는 데이터 개체(Entity),속성(Attribute),관계(Relationship) 및 데이터 조작 시 데이터 값들이 갖는 제약 조건 등에 관해 전반적으로 정의 스키마
"빅데이터 시대에는 다양한 사업자들이 각종 사용자 데이터나 M2M센서등에서 수집된 데이터를 가공처리 저장해두고, 이 데이터에 접근할 수 있도록 API를 공개하고, 다양한 서드파티 사업자들이 비즈니스에 필요한 정보를 추출해 활용하게 될것이다." 플랫폼
서비스 사용자와 광고주를 연결하는 비즈니스에서 가장 중요한 것은 사용자의 특성을 보다 정교하게 파악해 광고주가 도달하고자 하는 정확한 고객군을 만들어 내는 것이다. 이 목표를 위해 활용되기 시작한 것은? 사용자 로그
분석과제를 도출하기 위한 방식은 문제가 주어진 경우 해법을 찾기 위하여 정차적으로 수행하는 (ㄱ)방식과 문제의 정의 자체가 어려운 경우 데이터를 기반으로 탐색하고 이를 지속적으로 개선해나가는 방식인 (ㄴ)으로  분류된다 (ㄱ) : 하향식 접근방식
(ㄴ) : 상향식 접근방식
분석기획은 단기적으로는 (ㄱ)를 도출하여 프로젝트화 한 후 관리를 수행하여 분석결과를 도출하는 것이고, 중장기적으로는 (ㄴ)를 수행하여 지속적인 (ㄱ)수행을 지원할 수 있는 거버넌스 체계를 수립하는 것이다 (ㄱ) : 분석과제
(ㄴ) : 분석 마스터 플랜
분석과제에 대한 포트폴리오 사분면 분석을 통해 과제의 1차적 우선순위를 결정하고, 분석 과제별 적용범위 및 방식을 고려하여 최종적인 실행 우선순위를 경정한 후 실행하는 것으로 단계별로 추진하고자 하는 목표를 명확히 정의하고, 추진과제별 선 후행 관계를 고려하여 단계별 추진내용을 정렬하는 과정 단계적 구현 로드맵
개인의 사생활 침해를 방지하고 통계 응답다의 비밀사항은 보호하면서 통계자료의 유용성을 최대한 확보할 수 있는 데이터변환 방법 마스킹
인터넷상의 서버에서 데이터 저장, 처리, 네트워크 콘텐츠 사용 등 서로 다른 물리적인 위치에 존재하는 컴퓨팅 자원을 가상화 기술을 통해 IT관련 서비스를 한번에 제공하는 혁신적인 컴퓨팅 기술 클라우드 컴퓨팅
데이터 사이언티스트란 데이터로부터 의미있는 정보를 추출하는 학문이다. 통계학이 정형화된 실험 데이터를 분석 대상으로 하는 것에 비해, 데이터 사이언스는 정형 또는 (ㄱ)을 막론하고 인터넷, 휴대전화, 감시용 카메라 등에서 생성되는 숫자와 문자,영상 정보 등 다양한 유형의 데이터를 대상으로 한다 (ㄱ) : 비정형
인터넷 등 각종 경로로 정보를 수집하는 구글은 이미 지난 2010년에 서비스 이용자가 1시간 뒤 어떤일을 할 지.... 예측할 수 있는 데이터와 분석 신뢰도를 확보하고 있다고 했다. 여행 사실을 트윗한 사람의 집에 강도가 노리는 고전적 사례도 발생, 이러한 사례를 통해 알 수 있는 빅데이터 시대의 위기요인 사생활 침해
구글에서 대용량 데이터 처리를 분산 병렬 컴퓨팅에서 처리하기 위한 목적으로 제작하여 2004년 발표한 소프트웨어 프레임워크로 페타바이트 이상의 대용량 데이터를 신뢰도가 낮은 컴퓨터로 구성된 클러스터 환경에서 병렬처리를 지원하기 위해서 개발된것 맵 리듀스

 

출처 : https://data-make.tistory.com/145 [Data Makes Our Future]

반응형