Doris 再次啟動FE失敗的思考

2023-08-28 06:00:42

Doris再次啟動FE失敗的思考

背景描述

在昨天已經成功下載安裝最新穩定版docker、拉取doris-0.15.0版本的映象、將映象掛載道本地Doris原始碼目錄、完成了doris的編譯之後,今天在繼續按照檔案進行叢集部署時,基本沒遇到什麼問題,後面在檢視be節點狀態時發現hadoop102節點的可用空間只有3個G,便想給hadoop102叢集擴容

問題描述

直接關掉虛擬機器器後,刪除所有快照(不刪不讓在VMvare的設定裡面修改虛擬機器器的空間),然後將空間從50G改到了80G--(後來才知道在設定裡面擴充套件的是虛擬磁碟空間)--,重啟時出現的一個問題也都解決了,但是hadoop102節點的狀態發生了改變,回退了很多操作,導致我需要重新給他設定並啟動doris,我從其他節點直接拷貝組態檔過來,然後執行fe報錯,執行其他節點的fe也會報錯

問題原因

Centos7磁碟空間擴容操作不規範,刪掉所有快照,回退了操作,導致叢集出現故障
Centos7磁碟空間擴容

報錯資訊

一、FE啟動失敗,fe.log 中一直捲動如下資訊:
wait catalog to be ready. FE type UNKNOWN

聽說是因為doris暫時不支援ip變動,因為fe主節點ip變化 導致無法啟動,換個版本重新編譯一遍,再部署一次就好了

二、嘗試使用Mysql使用者端連線Doris時報錯
Lost connection to MySQL server at 'reading initial communication packet', system error: 0

通常是因為編譯 FE 時使用的 jdk 版本和執行 FE 時使用的 jdk 版本不同導致的。


三、啟動FE時,使用jps命令看不到程序,檢視紀錄檔
java.lang.Suchmethoderror: java.nio. ByteBuffer. limit (I)Ljava/nio/ByteBuffer;

Docker 裡預設是 JDK 11,如果您的安裝環境是使用 JDK8 ,需要在 Docker 裡 JDK 環境切換成 JDK8


四、啟動FE錯誤:
找不到或無法載入主類 org.apache.doris.PaloFe

思路可以


尚未解決

Doris官方常見報錯處理指導檔案
問題相似,可以參考

他的問題是FE掛掉後,啟動不起來了


這個關係不大
可能有點用

思考

一、

我用docker build編譯完doris後(編譯前我有將Docker映象掛載到本地),關機或重啟節點,我還需要去重新啟動一下docker嗎?還是去本地掛載目錄下直接設定執行doris

二、如果恢復到剛擴容重啟的時候你會怎麼做?

是嚮往常一樣死馬當活馬醫,看到一個解決方法就拿來試試,還是捋順思路後再動手,沒搞清楚問題本質前,寧可擱置,也不讓事態繼續惡化

其他問題

問題描述

直接在VMvare裡面通過設定擴充套件虛擬磁碟的容量,重啟虛擬機器器時遇到的問題

錯誤資訊

重啟後命令列提示如下:

generating 「/run/initramfs/rdsosreport.txt」
entering emergencymode. exit the shell to continue
type 「journalctl」 to view system logs.
you might want to save 「/run/initramfs/rdsosreport.txt」 to a usb stick or /boot after mounting them and attach it to a bug report。

解決方法

檢視裝置的資訊
# ls /dev/mapper/

這裡會顯示三個裝置,其中有一個: xxxx-root,我的虛擬機器器是:rhel-root
問題修復:

# xfs_repair /dev/mapper/rhel-root

上述命令執行後,提示: xxxx busy...(大致意思就是:那塊裝置正在被使用)
此時,需要嘗試先解除安裝那塊裝置。

# umount /rhel-root
解除安裝之後,在此嘗試修復(此時可以正常修復)
# xfs_repair /dev/mapper/rhel-root
上述命令不能修復,需要新增引數 -L
# xfs_repair /dev/mapper/rhel-root -L