<aside>
💡 (Apache) Hadoop : High-Availability Distributed Object-Oriented Platform의 약자로
</aside>
Source : https://velog.io/@shinychan95/0323-2-Hadoop-Ecosystem
- Apache(아파치) 재단에서 관리하는 프리웨어인 Hadoop Project에서 만들어지는 모든 소프트웨어 솔루션들의 집합을 얘기한다.
HDFS (Hadoop Distributed File System)
Source : https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html
node
:
rack
:
cluster
:
- Namenode는 실제 데이터가 어떤 Datanode에 저장되어 있는지를 관리하는 메타데이터를 관리하는 노드이다.
- Datanode엔 실제 데이터가 분산 저장된다. (replica들이 존재함)
YARN (Yet Another Resource Negotiator)
- Resource Manager는 각 Node Manager가 각 Node의 리소스를 얼마나 사용하는지를 관리한다.