[Hadoop] Ubuntu 18.04 + Hadoop 3.1.3 Setting On Linux
학부때 배운 리눅스 지식으로 리눅스 기반 하둡을 설치하려고 하니, 기본적인 리눅스 셋팅에서 많이 해맸던 것 같다.
한단계씩 꾸준히 따라오면 설치 할수 있다.
아파치 하둡 공식 문서에서 가이드 해주는 내용과 구글링을 참고하여 진행하였다.
1. 사전 작업
1) SSH
-
apt-get update 실행
$ sudo apt-get update
-
SSH, pdsh 다운로드
$ sudo apt-get install ssh $ sudo apt-get install pdsh
-
ssh 설정
-
pdsh 환경설정
bashrc 파일 열기
log@ubuntu:~/hadoop/hadoop-3.1.3$ sudo nano ~/.bashrc
아래 환경변수 추가
export PDSH_RCMD_TYPE=ssh
-
파일 적용
log@ubuntu:~/hadoop/hadoop-3.1.3$ source ~/.bashrc
2) Java
자바 다운로드
- apt-get update
$ sudo apt-get update
-
apt-get install java
-
java verison 확인
자바 환경설정
/etc/environment 에서 자바 환경 변수를 설정해준다.
설정 후 적용해준다.
source /etc/enviroment
2. 하둡 설치
1) 다운로드
-
wget을 이용하여 hadoop mirror 홈페이지의 사이트 주소를 통해 하둡을 다운 받는다.
wget http://apache.mirror.cdnetworks.com/hadoop/common/
-
하둡 폴더 생성
-
다운 받은 폴더를 하둡 폴더 경로에 압축 해제 한다.
2) 설정
하둡 외부 환경설정
어느 경로에 있든 하둡을 실행하기 위해 하둡 환경설정을 한다.
$ sudo nano ~/.bashrc
환경 설정 변수 추가
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
export HADOOP_HOME=/home/log/hadoop/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
export HADOOP_MAPRED_HOME=${HADOOP_HOME}
export HADOOP_COMMON_HOME=${HADOOP_HOME}
export HADOOP_HDFS_HOME=${HADOOP_HOME}
export YARN_HOME=${HADOOP_HOME}
-
변경 내용 적용
$ source ~/.bashrc
하둡 내부 환경 설정
datanode, namenode 폴더 생성 및 권한 주기
hadoop-env.sh
-
자바 설치 경로 확인
-
nano 편집기로 파일 열기
log@ubuntu:~/hadoop/hadoop-3.1.3$ sudo nano etc/hadoop/hadoop-env.sh
-
etc/hadoop/hadoop-env.sh 에 자바 경로 추가
core-site.yml
-
nano 편집기로 파일 열기
log@ubuntu:~/hadoop/hadoop-3.1.3$ sudo nano etc/hadoop/core-site.xml
-
property 내용 추가
```xml
```
![image-20200713000038535](/assets/images/2020-07-06-ubuntu18-hadoop-3/image-20200713000038535.png)
hdfs-site.yml
-
nano 편집기로 파일 열기
log@ubuntu:~/hadoop/hadoop-3.1.3$ sudo nano etc/hadoop/hdfs-site.xml
-
아래 내용 추가
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
yarn-site.yml
3. 하둡 실행
1) 하둡 실행 명령어
format namenode
log@ubuntu:~/hadoop/hadoop-3.1.3$ bin/hdfs namenode -format
run hadoop
-
dfs 실행
log@ubuntu:~/hadoop/hadoop-3.1.3$ sbin/start-dfs.sh
-
yarn 실행
log@ubuntu:~/hadoop/hadoop-3.1.3$ sbin/start-yarn.sh
2) 웹 사이트 확인
웹사이트에서 하둡 동작 확인
http://localhost:8088/cluster
http://localhost:9870
참고
하둡 3부터 50070 포트가 9870으로 변경됨.
댓글남기기