夜中にサーバーアクセスできなくなった原因と結果

広告

20日の午前0時から午前3時半くらいまで、サーバーアクセスができなくなりました。

原因は、自然発生のトラブルと人為的(自分の)ミスの重なりで被害が大きくなったことでした。

  1. 最初の異変 evernoteが同期失敗のメッセージを出した。
    Windows PCの動作が、極端に遅くなっていたので、その影響かと考えた。
  2. ブログ記事の原稿のチェックをしたら、リンクができなくなっている。
    リンクを作るときのミスと思っていたけれど、全部の記事で同じことが起きている。
  3. ためしに、Yahooにアクセスしようといたら、できなくなっている。
  4. ルーターにはアクセスできたので、syslogを見ると、記録はOUTばかりになっている。
    外に出られなくなっているらしい。
  5. サーバーへの外部からのアスせスが気になって、iPnoneでグローバルアドレスでポートにアクセスしてみたら、アクセスできない。
  6. ローカルからサーバーへの接続は可能、アパッチもPHPも正常な状態で、サーバーは生きている。
  7. ほかに手が考えられなかったので、ルーターを一旦プロバイダと遮断することにした。
  8. 再接続後、Windows PCは通信が再開できたけれど、外部からサーバへのアクセスができない。
    この時点で、グロ-バルアドレスが変更になっている。
  9. 気になったことが有って、外部サーバーに置いてあるブログサイトに接続すると、表示するのにすごく時間がかかるようになっている。
  10. 同じサーバーに置いてある、PPC用のサイトは、一瞬で表示する。
    気になったこととは、アクセス解析のデータを、ローカルのサーバーに置いているので、このサーバーとの接続ができないと、影響が出るのではないかと考えたから。
  11. 外部からサーバーへのアクセスが回復しない。
  12. サーバーに不正アクセスがあって接続を遮断しているリストを確認してみると、変更前のグローバルIPアドレスが載っている。
  13. もうグローバルIPアドレスは、変わっているのだから影響はないはずだと思いながら、リストからこのIPアドレスを削除した。
  14. 外部からサーバーへのアクセスが回復した。
    表示まで時間がかかっていたサイトがすぐに表示できるようになった。
  15. なぜか古いグローバルアドレスが影響しているので、Value Domain のDNSを調べると、新しいグローバルアドレスの中に古いグローバルアドレスが残っていた。

今回のトラブルを振り返ると、自然に発生したトラブルのあと、自分のしたことがさらに事態を悪くしていたことが分かった。

たぶん、ルーターの接続を切って再接続したところで、20分か30分放っておけば、何事もなかったのだと思う。

  1. iPnoneでグローバルアドレスでポートにアクセスしたときに、サーバーが不正アクセスとして、グローバルアドレスを登録した。
  2. Value DomainのDNSに正しく情報を伝える設定(サーバー内のDiceの設定)に落ちがあって、アドレス変更情報を全部変更できていなかった。
  3. アクセス解析のコードを、</head> の直前に置いていたのが悪さして、ページの表示に時間がかかってしまった。
    PPC用の記事は、アクセス解析のコードを </body> の直前に置いてあったので、表示への影響がなかった。

ブログを持っている人は、アクセス解析のコードをどこに置くか迷うことがあると思います。

解析の精度から最適なところがあるのでしょうが、サイトを見に来てくれた人が、何かあっても快適にサイトを見てもらえるためには、</body> の前に置くのがいいのだと感じました。