Cloudera Data Platform(CDP)
제품 개요
Edge, Public/Private, Hybrid cloud, On Premise의 모든 환경에서 데이터 관리 및 분석을 포함한 통합적인 데이터 플랫폼
제품 특징 및 장점
- 고가용성 - HDFS High Availability를 적용하여 클러스터의 특정 노드 장애 시 지속적인 서비스 제공
- 작업 관리 및 모니터링 기능 - Resource Pool/Application 별로 주어진 리소스 대비 리소스 활용도를 제공
- 클러스터 관리 기능 - 클러스터 모니터링 구성정보 표시, 장애 통지 등 관리 기능 제공
- 빅데이터 처리 및 분석 기능 - Hive/Impala로 대량 데이터에 대한 SQL 쿼리 수행, Spark로 다양한 In-Memory 분석 수행 가능
- 데이터 이관과 배치 처리 - Sqoop으로 RDBMS에서 정형데이터 이관, Flume/Kafka로 비정형데이터의 통합 가능, Oozie로 Workflow를 구성하여 배치 처리 수행
적용 분야
공공기관 및 민간 민원인을 대상으로 한 데이터를 보유하고 있는 부서
`
대표적 구축 사례
국가정보자원관리원 혜안 온라인 민원 자동 분석 서비스