通知
すべてクリア

many nodes down


台坂博
(@daisaka)
Estimable Member
結合: 9年前
投稿: 116
Topic starter  

一橋大学の台坂です。いつもお世話になっております。

多くのノードがダウン状態になっております。対応をお願いできるでしょうか?


引用
Shinichi Hirahara
(@hira)
Estimable Member Admin
結合: 8年前
投稿: 106
 

台坂先生

エクサ平原です。

お世話になります。

ノード落ち確認しました。

k[02-12]n[01-04]すべてでテストを回した結果

t001k03n3、k07n04で関連するモジュール一本にエラーがありましたのでDrainにしております

それ以外は復旧させました。次回訪問時にモジュールの交換を予定します。

 

また、t001k01の計算間違いですが、こちらでHPLを流すテストを何回か連続で流してみましたが

エラーが出てきませんでした。(いつも我々はこのテストを使っています。)

台坂先生の流すプログラムで、エラーを吐くsc2モジュールまで特定できれば良いのですが

特定出来ないのであれば、次回ブリックごと交換を予定します。申し訳ありません。

宜しくお願いします。

 


返信引用
台坂博
(@daisaka)
Estimable Member
結合: 9年前
投稿: 116
Topic starter  

平原様、

一橋大学の台坂です。どうもありがとうございます。

t001k01n01 モジュール特定ですが、テスト用のプログラムを用意します。

少々、お時間いただければと。

あと、問題のノードが増えてしまいました。

- t001k08n[01-04] 

- t001k09n02

 確認をお願いできるでしょうか?

お手数をおかけしますが、よろしくお願いいたします。


返信引用