9.1將原CM節(jié)點數(shù)據(jù)遷移至新節(jié)點
9.1.1備份原CM節(jié)點數(shù)據(jù)
- 主要備份CM的監(jiān)控數(shù)據(jù)和管理信息典挑,數(shù)據(jù)目錄包括:
/var/lib/cloudera-host-monitor
/var/lib/cloudera-service-monitor
/var/lib/cloudera-scm-server
/var/lib/cloudera-scm-eventserver
/var/lib/cloudera-scm-headlamp
### 注意:將備份命令壓縮傳輸佃却,防止目錄的屬主和權(quán)限變化
9.1.2 修改CM的數(shù)據(jù)庫配置信息
- 修改新CM的數(shù)據(jù)庫配置文件/etc/cloudera-scm-server/db.properties珊佣,配置文件內(nèi)容
[root@ip-172-31-18-97 cloudera-scm-server]# sudo vim db.properties
# Copyright (c) 2012 Cloudera, Inc. All rights reserved.
#
# This file describes the database connection.
#
# The database type
# Currently 'mysql', 'postgresql' and 'oracle' are valid databases.
com.cloudera.cmf.db.type=mysql
# The database host
# If a non standard port is needed, use 'hostname:port'
com.cloudera.cmf.db.host=localhost
# The database name
com.cloudera.cmf.db.name=cm
# The database user
com.cloudera.cmf.db.user=cm
# The database user's password
com.cloudera.cmf.db.password=123456
# The db setup type
# By default, it is set to INIT
# If scm-server uses Embedded DB then it is set to EMBEDDED
# If scm-server uses External DB then it is set to EXTERNAL
com.cloudera.cmf.db.setupType=EXTERNAL
-
根據(jù)自己的配置信息對標紅部分進行修改
9.1.3 CM備份數(shù)據(jù)導(dǎo)入新節(jié)點
-
將原CM上備份的數(shù)據(jù)拷貝到新CM節(jié)點上
- 通過如下命令將備份數(shù)據(jù)還原至對應(yīng)目錄
[ec2-user@ip-172-31-18-97 cmbak]$ sudo tar -zxvf cloudera-host-monitor.tar.gz -C /var/lib/
[ec2-user@ip-172-31-18-97 cmbak]$ sudo tar -zxvf cloudera-service-monitor.tar.gz -C /var/lib/
[ec2-user@ip-172-31-18-97 cmbak]$ sudo tar -zxvf cloudera-scm-server.tar.gz -C /var/lib/
[ec2-user@ip-172-31-18-97 cmbak]$ sudo tar -zxvf cloudera-scm-eventserver.tar.gz -C /var/lib/
[ec2-user@ip-172-31-18-97 cmbak]$ sudo tar -zxvf cloudera-scm-headlamp.tar.gz -C /var/lib/
9.1.4 更新集群所有節(jié)點的CM Server指向
-
修改集群所有節(jié)點上/etc/cloudera-scm-agent/config.ini文件中server_host值為新CM節(jié)點的hostname
9.1.5 將原CM節(jié)點的CM Service角色遷移至新節(jié)點
- 啟動新CM節(jié)點的cloudera-scm-server和cloudera-scm-agent服務(wù)
[ec2-user@ip-172-31-18-97 253back]# sudo systemctl start cloudera-scm-server
[ec2-user@ip-172-31-18-97 253back]# sudo systemctl start cloudera-scm-agent
### 注意:在新CM節(jié)點上啟動cloudera-scm-agent服務(wù)后,會將CM節(jié)點的信息添加到cm庫的HOSTS表中,查看新CM節(jié)點對應(yīng)的HOSTS_ID
-
登錄mysql數(shù)據(jù)庫將,查看cm.HOSTS表中的Cloudera Manager的host信息
-
未遷移前可以通過CM管理界面看到新CM節(jié)點是沒有任何角色
- 通過如下命令,將舊CM的角色遷移至新CM節(jié)點上
update ROLES set HOST_ID=11 where NAME like 'mgmt%';
-
執(zhí)行操作后舶得,原CM節(jié)點的角色被遷移至新CM節(jié)點
- 通過CM管理界面將原CM節(jié)點從集群刪除
- 將原CM節(jié)點刪除
- 由于集群配置了Kerberos,則需要更新Kerberos的server爽蝴,如果Kerberos未遷移則不需要考慮此步
- 通過CM管理界面啟動Cloudera Management Service
- 由于做了數(shù)據(jù)庫遷移扩灯,所以需要修改hive/hue/oozie對應(yīng)的數(shù)據(jù)庫配置
- 未做數(shù)據(jù)庫遷移可跳過此步
- 進行以上修改后重啟集群
9.2 遷移后集群服務(wù)驗證
- 原CM的運行界面,歷史監(jiān)控數(shù)據(jù)
- 登錄CM管理平臺霜瘪,查看集群狀態(tài)正常
- 遷移后可以查看正常查看集群的歷史監(jiān)控數(shù)據(jù)
-
Hue訪問及操作正常
-
HDFS訪問及操作正常
-
HBase通過hue和shell正常操作
-
9.3 常見問題解決
9.3.1 常見問題一
-
由于cloudera-scm-agent服務(wù)于supervisord之間通信異常導(dǎo)致問題珠插。
- 解決方法:
- 將告警節(jié)點上的supervisord進程殺死,然后重啟agent服務(wù)
[root@ip-172-31-28-37 cloudera-scm-agent]# ps -ef |grep supervisord
root 26910 1 0 07:02 ? 00:00:00 /usr/lib64/cmf/agent/build/env/bin/python /usr/lib64/cmf/agent/build/env/bin/supervisord
root 28806 28748 0 07:03 pts/0 00:00:00 grep --color=auto supervisord
[root@ip-172-31-28-37 cloudera-scm-agent]# kill -9 26910
[root@ip-172-31-28-37 cloudera-scm-agent]# systemctl restart cloudera-scm-agent
9.3.2 常見問題二
-
由于在CM遷移時颖对,未遷移/opt/cloudera/csd目錄導(dǎo)致問題捻撑。
- 解決方法:
- 將原CM節(jié)點上/opt/cloudera/csd目錄拷貝至新CM節(jié)點對應(yīng)的目錄
- 重啟cloudera-scm-server服務(wù)
[ec2-user@ip-172-31-18-97 253back]# sudo systemctl start cloudera-scm-server
9.3.3 常見問題三
- Service Monitor啟動失敗導(dǎo)致異常信息
- 由于CM遷移時,/var/lib/cloudera-service-monitor目錄的文件缺失導(dǎo)致
- 解決方法:
- 將/var/lib/cloudera-service-monitor目錄的數(shù)據(jù)重新覆蓋
9.3.4 常見問題四
- 在集群遷移完成后缤底,集群啟動后做了高可用服務(wù)的NameNode和ResourceManager服務(wù)均不能正常顯示主備節(jié)點顾患,HDFS的匯總信息無法正常顯示
- 由于集群配置了kerberos,新CM節(jié)點未生成keytab導(dǎo)致
- 解決方法:
- 將CM節(jié)點的所有服務(wù)停掉个唧,然后生成該主機的keytab
9.4 總結(jié)
- 如何在不停止集群服務(wù)的情況下進行CM遷移江解,需要滿足如下條件:
- 新CM節(jié)點的hostname與IP地址與舊CM節(jié)點一致;
- 如果需要遷移數(shù)據(jù)庫徙歼,則新數(shù)據(jù)庫的hostname與IP地址與原數(shù)據(jù)庫一致犁河,且需要將原數(shù)據(jù)庫的數(shù)據(jù)導(dǎo)入到新庫中鳖枕;
- 如果需要遷移Kerberos MIT KDC,則新MIT KDC所在節(jié)點與舊MIT KDC節(jié)點的hostname與IP地址一致桨螺,且需要將舊MIT KDC數(shù)據(jù)庫數(shù)據(jù)導(dǎo)入新MIT KDC數(shù)據(jù)庫中宾符;
- 注意:如果只做第1步操作,則不需要重啟hadoop集群相關(guān)服務(wù)灭翔,并且不會影響hadoop集群現(xiàn)有作業(yè)魏烫;如果進行2、3步操作會對集群作業(yè)造成短暫影響肝箱,但不需要重啟hadoop集群相關(guān)服務(wù)哄褒;
大數(shù)據(jù)視頻推薦:
騰訊課堂
CSDN
大數(shù)據(jù)語音推薦:
企業(yè)級大數(shù)據(jù)技術(shù)應(yīng)用
大數(shù)據(jù)機器學習案例之推薦系統(tǒng)
自然語言處理
大數(shù)據(jù)基礎(chǔ)
人工智能:深度學習入門到精通