通知
すべてクリア

2020Jan


石川正
(@tadashi-ishikawa)
Eminent Member
結合: 9年前
投稿: 41
Topic starter  

1/1 17:00 blue-feにping/sshで入れないので、KEKにきて見ました。

青睡蓮内部および冷却システムの異常はなし。20度です。

ジョブが流れていたのですが、温度をみると1/1の朝に止まったようです。

コンソールは真っ暗で何もできませんので、 電源を入れて直してみます

石川 正

 


引用
石川正
(@tadashi-ishikawa)
Eminent Member
結合: 9年前
投稿: 41
Topic starter  

blue-feをrebootしました。

ネット接続可能です。

2637,2964のジョブがこちらではscancelできません。キャンセルして構いません。

取り急ぎ、石川正


返信引用
Shinichi Hirahara
(@hira)
Estimable Member Admin
結合: 8年前
投稿: 106
 

石川先生、お手数おかけします。

現在ブリックの再起動を試みております。


返信引用
石川正
(@tadashi-ishikawa)
Eminent Member
結合: 9年前
投稿: 41
Topic starter  

平原様、ありがとうございます。

 


返信引用
Shinichi Hirahara
(@hira)
Estimable Member Admin
結合: 8年前
投稿: 106
 

石川先生

ブリックの電源のON/OFFはipmi経由のリモートで出来るので、eth系のネットワークは生きているのですが、ブリックとFE間のIBが接続されません。FEのIBはリンクアップしていますが、すべてのブリックに対して接続できていないので、IBSW--Brick間か、IBSWに問題がある可能性があります。

FEがまた落ちたりするとブリックの制御ができなくなるので、全ブリックの電源を落としておきます。


返信引用
石川正
(@tadashi-ishikawa)
Eminent Member
結合: 9年前
投稿: 41
Topic starter  

了解しました。後日よろしくお願いします。石川正


返信引用
yamaura
(@yamaura)
Eminent Member Admin
結合: 8年前
投稿: 20
 

石川先生

復旧させました。


返信引用
石川正
(@tadashi-ishikawa)
Eminent Member
結合: 9年前
投稿: 41
Topic starter  

山浦様、皆様

ありがとうございました。

石川 正


返信引用
石川正
(@tadashi-ishikawa)
Eminent Member
結合: 9年前
投稿: 41
Topic starter  

時々(10本に一本ぐらいか)t1n023が次のようなメッセージが出て、ジョブがハングします。

[t1n023:17277] [[44440,0],0]->[[44440,0],32] mca_oob_tcp_msg_send_bytes: write failed: Broken pipe (32) [sd = 25]

取り急ぎ、情報まで

石川 正


返信引用