通知
すべてクリア

[解決済] something wrong on t001k10n02


台坂博
(@daisaka)
Estimable Member
結合: 9年前
投稿: 116
Topic starter  

一橋大学の台坂です。いつもお世話になっております。

昨日の立ち上げ作業も大変お疲れ様でした。

早速計算を流しましたが、

t001k10n02

が不調のようです。再起動をお願いできるでしょうか?

よろしくお願いいたします。

 


引用
台坂博
(@daisaka)
Estimable Member
結合: 9年前
投稿: 116
Topic starter  

一橋大学の台坂です。いつもお世話になっております。

ダウンしているノードが増えてしまいました。

t001k02n[01-04],t001k05n[01-04],t001k07n[01-04],t001k08n[01-04],t001k09n[01-04],t001k10n[01-04],t001k12n[01-04]

また、es1fe も少し問題があるようです。以下が表示されます。

[daisaka@suiren2 ~]$
Message from syslogd@suiren2 at Aug 9 06:38:44 ...
kernel:BUG: soft lockup - CPU#10 stuck for 22s! [fping:20592]

 

対応のほど、よろしくお願いいたします。


返信引用
Shinichi Hirahara
(@hira)
Estimable Member Admin
結合: 8年前
投稿: 106
 

台坂先生

エクサ平原です。お世話になります。

各ノード復旧させました。

es1feに関しては調査いたします。

宜しくお願いします。


返信引用
台坂博
(@daisaka)
Estimable Member
結合: 9年前
投稿: 116
Topic starter  

平原様、

一橋大学の台坂です。対応をどうもありがとうございました。

 jobが再投入を確認しました。

es1feの調査の方、よろしくお願いいたします。


返信引用
yamaura
(@yamaura)
Eminent Member Admin
結合: 8年前
投稿: 20
 

Message from syslogd@suiren2 at Aug 9 06:38:44 ...
kernel:BUG: soft lockup - CPU#10 stuck for 22s! [fping:20592]

 

こちらのログは、無視していただいて構いません。
ずっと出続けているようなら問題ですが。


返信引用