본문 바로가기

컴퓨터 공학 자료(학부)/Hadoop

하둡 디렉토리 구조

각각의 디렉토리에 관한 간략한 설명이다.

( 0.20 버전 디렉토리 구조. 0.21dptjsms mapred, hdfs, common으로 디렉토리 구조가 분리, 소스는 각 디렉토리 내부로 이동됨)

 

bin

하둡을 실행하거나 관리하는 스크립트

 

c++

JNI기반의 c++ 클라이언트 라이브러리

 

conf

환경 설정 파일

 

contrib

streaming, scheduler, eclipse-plugin 등과 같이 하둡 메인 코드에는 반영되지 않았지만, 다양한 기능을 수행하게 하는 도구들이 포함돼 있다. 이 디렉토리는 이미 빌드돼 jar파일로 패킹되어 있으며, 소스는src 디렉토리에 있다.

 

docs

하둡관련 문서와 javadoc API문서

 

ivy

하둡에서 사용하는 라이브러리의 의존성 관리를 위한 ivy설정. 하둡을 빌드할 때에만 사용하고 실행만 하는 경우에는 사용하지 않음

 

lib

하둡에서 사용하는 라이브러리가 있는 디렉토리. 하둡을 이요한 클라이언트 라이브러리는 이 디렉토리에 있는 jar 파일이 클래스패스에 포함돼야 한다. bin디렉토리에 있는 스크립트 명령은 자동으로 lib에 있는 jar파일을 클래스패스에 추가해 실행

 

librecordio

하둡의 record I/O의 c++ 라이브러리. record I/O은 프로그래밍 언어와 상관 없이 데이터를 저장하고 사용하기 위해 하둡에서 정의한 구조

 

src

하둡의 소스 디렉토리로 core, hdfs, mapreduce등과 같은 메인 프로그램의 소스뿐만 아니라 JNI기반의 C++ 클라이언트 코드, 예제, API 문서와 활용 문서등이 있다.

 

webapps

하둡은 관리용 또는 서버들 간의 데이터 통신을 위해 일부 http통신을 수행한다. 이때 jetty 웹서버를 사용하는데, jetty 웹서버에서 사용하는 웹 컨텍스트 설정 관련 디렉토리다.


출처:http://blog.naver.com/cookatrice/50107905854


'컴퓨터 공학 자료(학부) > Hadoop' 카테고리의 다른 글

하둡 설치방식 분류  (0) 2011.11.14
ssh 설치 및 설정  (0) 2011.11.09