流転工房

シンギュラリティをこの目に

新幹線システムCOSMOS障害、、動き出したら触れないシステムか。

10年以上の運用システム、気づいたら処理能力が限界に来ていた。
2008年にシステム更新があったようだけど、社会インフラに密接につながってしまったシステムの「現行踏襲」設計思想が垣間見える。。


2010/01/17 読売新聞 抜粋
新幹線運行システム、15年間増強せず 大量のダイヤ変更処理できず

JR東日本は18日、雪の影響でダイヤを一度に変えた結果、システムの処理能力を超えたことが原因だったと発表した。処理能力は1995年のシステム導入時から増強しておらず、JR東は設計上不備があったことを認めて謝罪した。
 
コスモスが1分間に表示できる修正箇所は600件だが、この時修正の操作が集中し、上限を超過。その結果、端末の表示が不安定になったという。

同社の新幹線の運行数は、コスモスを導入した95年当時の1日230本から2011年の同320本に増えた。08年にはシステムが更新されたが、処理能力は導入当時のままだった。

処理能力の上限に達しないよう操作を制限することもできたが、運行本部の指令員7人は能力に限界があることを知らなかった。

JR東は600件を超えた件数も処理できるようプログラムを改善するなどの対応を取る方針。

トラブルは17日午前8時23分ごろ発生した。
東京の運行本部にあるコスモスの端末22台すべてで、各駅の到着時刻や引き込む路線を示すデータがついたり消えたりする異常が起きたため運行を中止。約1時間15分後に全面再開した。


2010/01/19 読売新聞 抜粋
新幹線障害、予備系に切り替えず…国説明要求へ

東北、上越、長野などの各新幹線で17日、システム障害で一時的に列車の運行ができなくなった問題で、JR東日本では「別のトラブルが起きるリスクがある」として、予備システムへの切り替えを行っていなかったことがわかった。

その後、障害が短時間で自然復旧したため、同社では原因が特定できないまま、問題が起きたメーンのシステムで運行再開を決めていた。国土交通省は今後、システムの管理体制やバックアップが適切だったかなどについて同社から説明を求める方針。


でも、運行本部の指令員7人が処理能力を知らなかったことに言及するのは、ちと気の毒な。。
文面からは、プログラムミスのようだし、ハード増強が必要な端末数でもないし。

それから、待機系に切り替えなかったのは、この場合、仕方がなかったと思う。
失礼な推測ながら、こうした大御所システムの待機系切り替えは、システムリリース後は実績も少ない(なさそう)だし。