Hadoop Ecosystem1 [NCloud] Cloud Hadoop 개념 1. Hadoop 이란? - High Availability Distributed Object Oriented Platform - 고가용성 분산형 객체 지향적 플랫폼 2. Hadoop Ecosystem Apache Hadoop 소프트웨어 라이브러리를 이루는 다양한 구성 요소 1) Hadoop - 클러스터 전체에 대규모 데이터세트를 분산처리할 수 있는 프레임워크 2) Ambari - 리소스 할당, 관리, 모니터링 하기위한 웹 기반 대시보드 3) Zeppelin Notebook - 코드 작성, 실행, 결과확인, 수정이 가능한 웹 기반 작업환경 - Spark CLI 환경을 GUI 환경으로 제공함으로써 불편함 해소 - 확장성 : Spark, Livy, Cassandra, Lens 등 데이터분석도구 지원 SQL .. 2023. 7. 5. 이전 1 다음