1. 决定各个服务组件在哪台服务器运行的配置
1.1. NameNode
etc/hadoop/core-site.xml
1 | <property> |
1.2. DataNode
etc/hadoop/slaves
1 | # 一行代表一个datanode所在主机 |
1.3. SecondaryNameNode
hdfs-site.xml
1 | <property> |
1.4. ResourceManager
yarn-site.xml
1 | <property> |
1.5. NodeManager
NodeManager和DataNode的数量是恒定1:1的关系。Hadoop的设计原则是计算向数据靠拢,故NodeManager要向DataNode靠拢。在一般情况下,DataNode在哪个节点,NodeManager就会在哪个节点启动。
DataNode的地址由slaves文件决定,所以説,NodeManager的地址也由slaves文件决定。
1 | # etc/hadoop/slaves,一行代表一个datanode及nodemanager所在主机 |
在yarn-site.xml中有以下配置,应该是设置NodeManager服务监听的IP,而不是决定在哪台机器上启动
1 | <property> |
1.6. MapReduce JobHistory
mapred-site.xml
1 | <property> |