NTT東日本のフレッツ障害

OSPFのメルトダウンは、やはり怖いものだと思う。フレッツの場合は、複数ISPへの接続を確保するために、LAC-LNSをL2TPで結ぶ構成となっている。機器能力の都合上、LACもLNSも台数が増加する傾向にある。また、フレッツISDNADSLBフレッツと見込みを上回る顧客獲得数があったため、LAC-LNSをひたすら増やすこととなった。

さらに、LACはサービスを提供するGC局全てに配置していくわけだが、NTTのGC局間のファイバーはメッシュではなくリング構成になっており、なかなかうまく上流・下流が切り分けにくい。そんな事情があって、ルータ台数の増加と経路数の増加を招いていたようである。

OSPFはコンバージェンス速度重視のIGPであるため、スタビリティーとスケーラビリティー重視のBGPに比べて大規模構成を実現するのには問題が多い。かといって物理的・論理的構成やアドレッシングなどの問題で、簡単にBGPにするわけにはいかないだろう。なので、機器集約を進めるなどの方法が現時点では解決策なのかなあ、と思う。

もっとも、集約すれば何でも良いというものではない。Accaは小型のLNSのかわりに、大型のBASを置き、ここで大量のPPPセッションを終端させる構成とした。平常時はいいのだが、このBASが死ぬと甚大な影響が出る。というか、出て騒ぎになったことがあった。