Webサーバーのダウンタイム問題に直面している場合、すぐに問題を解決し、このような事件が再び起こらないようにするのに役立ついくつかのトリックをご紹介します。
過去20年間で、インターネットは文明に不可欠なものとなりました。社会的ニーズの階層において、飲料水や安定した電力供給のすぐ下に位置するインターネットは、過去半世紀の間、人類社会に生産性、個人的レクリエーション、そして全体的な生活の質の向上をかつてないほどもたらしました。
ノード
学術的な研究、個人的な学習、ピザの注文など、Webサイトへのアクセスによってニーズを満たすことは、現代の多くのユーザーに受け入れられています。競争するために、最も評判の高い企業は、世界クラスのウェブサイト開発、一般的に言えば、綿密なウェブサーバー開発、設定、および保守に踏み切りました。企業がウェブサービスにますます依存するようになるにつれ、これらのサーバー構成はより複雑化し、サーバーやクラスタのダウンタイムに対する緊急時対応計画により重点を置く必要があります。
冗長性とウェブサーバー
次のステップに進む前に、まず冗長性の重要性を強調しましょう。かつては、冗長化ソリューションはさまざまでしたが、いずれも物理的なハードウェアを調達して導入するものでした。今日では、仮想化の普及が冗長化プラットフォームの設計と実装に雪だるま式に影響を及ぼしています。企業環境では依然として複数のサーバーが必要ですが、その数は考えられているほど多くありません。仮想化プラットフォームにかかわらず、詳細な計画や設計を行わずに単に仮想化プラットフォームを選択することは、Webサーバーのダウンタイムや障害発生時間を削減するという目標からは程遠いものです。
ステップ1:何が起こりましたか?
システム管理者は、Webサーバーのダウンタイムの原因を分析し、特定する責任を負わなければなりません。以下の問題に対処する必要があります:
- 停電、発電機のテスト、その他同様の問題は、全体的な物理的環境に影響を及ぼしていますか?
- ウェブサーバーとの通信は完全にブロックされていますか、それとも特定のIPセグメントはまだ利用可能ですか?
- サーバーの管理は可能ですか?
- ログに異常はありますか?
これらは、管理者が問題の診断に入る前にすぐに答えなければならない質問のほんの一部であり、まず上記の質問に対処する必要があります。
ステップ2:最もシンプルな解決策はしばしばベスト
ハイレベルな問題の診断や、考えられるあらゆる技術的な問題や課題の分析にとらわれてしまうことは多々あります。実は、一歩引いてマクロな視点で問題を考えてみると、これまで数え切れないほどの工数とコストをかけながら解決できていなかった技術的な問題を解決できるかもしれません。例えば、メインフレームの電源は入っているのか、それとも誰かがうっかり電源コードに触れてしまったのか。マシンの電源は確かに入っているが、ネットワーク接続がない場合は、ネットワークケーブルや光ファイバーが接続されていないか、緩んでいないかをチェックする必要があります。このように、一見して明らかな低レベルのエラー解決策ばかりで、起こりそうもないと思われるかもしれませんが、経験豊富なシステム管理者であれば、このような状態はあなたが思っているよりもはるかに頻繁に起こると言うでしょう。
#p#
上記の2つのステップの後、ウェブサーバーがまだダウンしている場合でも、次の3つのステップがありますのでご安心ください。
ステップ3:基本的なトラブルシューティングがうまくいかない場合の対処法
ケーブルや周辺機器をすべてチェックしたところで、pingコマンドを使ってデバイスの状態を調べてみましょう。幸いなことに、pingコマンドはすべてのプラットフォームで共通であり、最も使いやすいコマンドです。LAN上のサーバーにpingを打つことができれば、LANの外からサーバーにpingを打ってサーバーを検出することができます。これにより、問題がサーバー・レベルではなく、スイッチングやルーティング・レベルにあるかどうかがすぐにわかります。さらに、ウェブサーバーが仮想化されている場合は、物理サーバーの実際のIPにpingを打ってみると、問題の切り分けがさらに容易になります。同じサーバーへの ping がまったく不可能で、ネットワーク接続も完全にチェックされていると判断された場合は、さらに詳細な分析が必要です。
ステップ4: できる限りのことをやってみましたが、サーバーはダウンしたままです。
ネットワークケーブルをチェックしました。また、サーバーにpingを打ってみましたが、それでもサーバーにアクセスできません。良い知らせは、問題を物理サーバーまたはオペレーティング・システム自体に突き止めることがすでに可能だということです。言い換えれば、マネージャーを既存の問題のトラブルシューティングに集中させることが可能になりました。
次に、下から上へのアプローチでレイヤーごとに問題をチェックするだけです。まず、ネットワーク・インターフェースとローカル・ネットワークのコンフィギュレーションが正常かどうかをチェックします。もしそうであれば、使用しているオペレーティング・システムのプラットフォームによって、Webサービスが正常にオンになっているかどうかを確認できます。Windows環境では、サーバーがWebサービスの役割を持っていることを確認する必要があります。Linux環境では、チェックはより複雑になり、http関連のファイルやサービスを探して、サーバーが稼働していることを確認してください。
ステップ5:絶望的な時こそ、絶望的な対策を
上記のいずれもうまくいかない場合は、ログを確認し、Webサーバーがダウンしているときにログに記録されたメッセージを特定するようにしてください。この情報を、トラブルシューティングと解決の分野でより経験豊富な専門家に送ると、より助けになるかもしれません。同様に、ネットワーク接続に問題がないことが確認された場合は、Wiresharkパケットグラビングツールを使用して、問題への対処を支援する方法として、ネットワーク上で送信されているデータを取得し、分析します。





