通知
すべてクリア

some nodes down


台坂博
(@daisaka)
Estimable Member
結合: 9年前
投稿: 116
Topic starter  

一橋大学の台坂です。いつもお世話になっております。

いくつかのノードがダウンしております。システムの再起動をお願いできるでしょうか?

よろしくお願いいたします。


引用
Shinichi Hirahara
(@hira)
Estimable Member Admin
結合: 8年前
投稿: 106
 

01,02,03,06,70 をリセット、テストし復旧させました。

宜しくお願いします。

 


返信引用
台坂博
(@daisaka)
Estimable Member
結合: 9年前
投稿: 116
Topic starter  

平原様、

休日の対応をどうもありがとうございました。

また、かなりの数のノードが不調になっています。把握しているだけでも、

t001k01, t001k04, t001k05, t001k07, t001k08

で、デバイスが見えない状態になっているもようです。

再起動をお願いいたします。

台坂洋


返信引用
Shinichi Hirahara
(@hira)
Estimable Member Admin
結合: 8年前
投稿: 106
 

確認したところ、

k01,04,05,06,07,08でノードが見えなくなっているようです。

石川先生のJobも流れてしまっているのですが、止めてリセットしてしまってよいでしょうか?

対処ノードはDrainingにしておきます。


返信引用
台坂博
(@daisaka)
Estimable Member
結合: 9年前
投稿: 116
Topic starter  

平原様、

対応をどうもありがとうございます。

はい、リセットをお願いいたします。

石川さんには、私からメールします。

よろしくお願いいたします。

台坂洋


返信引用
Shinichi Hirahara
(@hira)
Estimable Member Admin
結合: 8年前
投稿: 106
 

承知しました。

現在リセット後のテストを走らせております。

終わりましたらご連絡いたします。


返信引用
台坂博
(@daisaka)
Estimable Member
結合: 9年前
投稿: 116
Topic starter  

平原様、

よろしくお願いいたします。

 

別件ですが、他のマシンのターミナルと間違えて、es2feでログインしているターミナルでsu を実行してしまいました。もともと私が設定していたパスワードになっていたようで、rootになってしまいました。

念の為、お知らせいたします。

 

台坂洋


返信引用
Shinichi Hirahara
(@hira)
Estimable Member Admin
結合: 8年前
投稿: 106
 

台坂先生

お待たせしました。該当ノードのリセット

テスト終了し、復帰させました。

宜しくお願いします。


返信引用
台坂博
(@daisaka)
Estimable Member
結合: 9年前
投稿: 116
Topic starter  

平原様、

どうもありがとうございます。お手数をおかけしました。

台坂博


返信引用