Hadoop

이 문서는 토막글입니다.

이 문서는 토막글로 분류되는 800바이트 이하의 문서입니다. 토막글을 채우는 것은 기여자의 따뜻한 손길입니다. 이 틀을 적용할 시 틀의 매개변수로 분류:토막글의 하위 분류 중 적절한 분류를 지정해 주시기 바랍니다.

1 개요

Apache Hadoop(High-Availability Distributed Object-Oriented Platform)은 대량의 자료를 처리하기 위한 분산 응용프로그램을 지원하는 자바 프레임워크로 Apache Lucene의 하위 프로젝트이다.
원래 목적은 Nutch의 분산 처리를 위하여 개발되었으며, 맵 리듀스가 근본이다.

마스코트는 코끼리인데 아들이 가지고 놀던 코끼리 장난감을 보고 지었다고 한다.

2 구조

전체적으로 보자면 Map Reduce를 수행하는 모듈과 Input/Output과 저장을 담당하는 HDFS(Hadoop Distributed File System)으로 구분된다.

3 사용 예시

별도로 사용에 제한이 없는 라이센스를 가지고 있기때문에 Map Reduce를 이용하거나, 대량의 파일시스템을 처리하는 경우에 사용된다. 대표적으로는 Apache Lucene을 이용한 검색 엔진이라든지, Machine Learning, 빅 데이터 분석 등 여러 분야에서 사용되고 있다.