【運用保守】WEBサイト公開後にシステムを安定的に動かす為に必要なこと

エンジニア

WEBサイトを自分で作って公開する。

そのために一生懸命プログラミングの勉強をしたりしている。

または、既にWEBサイトを開発している人もいるかと思います。

では、WEBサイトを公開した後は何をするのでしょうか。

もちろん、そのサイトの目的により改善などを行っていく、更にWEBサイトを拡大していくなどはあるかもしれません。

でも、それにはそのWEBサイトが安定的に動いていなければならないですよね。

WEBサイトが安定的に動作するためには何をしておけば良いのでしょうか?

今回はWEBサイトのが正常に動かす為には何をすればよいかについてお話します。

内容としては以下になります。

今WEBサイトは正常に動いていますか?

今、あなたが公開したWEBサイトは正常に動いていますか?

アクセスしてみて、ざっくりとページを眺めている感じでは問題なさそうに見えます。

ただ、正常に動いているかは、わかりませんね。

また、今システムが危ない状態なのか、そうでないかもわかりません。

動き出したWEBサイトについての状況をしっかりと把握しておくこと。

それが大切になってきます。

状況を把握するには、システムに対して監視を入れる必要があります。

監視の代表例としては以下のようなものがあります。

監視項目監視内容
CPU使用率サーバのCPUの使用率を監視します。
ディスク使用量サーバのディスクの使用量を監視します。
メモリ使用量サーバのメモリ使用量を監視します。
ロードアベレージサーバのロードアベレージを監視します。
各プロセス死活監視ApacheやDBなどのプロセスが動いているかを監視します。
URL監視対象URLが正常な値を返すかを監視します。

それぞれの監視にて基準を満たさなければ、アラート(メール送信)を発報して、WEBサイトに異常が発生していることをシステムの管理者に知らせるなどを行います。

WEBサイトが正常に動いていることの確認と異常の事前検知を行うためアラートを発報する。

WEBサイトのエラーについて

次にWEBサイトとしてシステムが動き出した場合、様々なログが出力されいるはずです。

こちらのログに関しても特に気にしないといけないのがエラーログです。

システムで発生したエラーが出力されるものですね。

通常のログであれば、システムが正常に動いている場合に出力されるもののため、チェックをする必要はありませんが、エラーログは別ですね。

エラーログに情報が出力されているということは、システムに何か問題が発生しているということです。

このエラーログを定期的にチェックして、エラーの中身を確認する必要があります。

また、エラーがシステム上大きな問題となる内容の場合、修正が必要となります。

システムの問題が出力されるエラーログを定期的にチェックする。

脆弱性とEOL対策について

WEBサイトの動作に利用している、OSやソフトウェアなどに関して、日々脆弱性が発見されています。

また、その脆弱性に対応するための、パッチが提供されています。

システムの脆弱性に対しての対応を行うために、適時このパッチを当てていく必要があります。

また、このOSやソフトウェアにに関しては、各バージョンごとにEOLが定められています。

EOLとは、該当ソフトウェアに対して、サポートの終了、修正・更新プログラムの提供の終了という意味です。

このEOLを迎えたソフトウェアについては、脆弱性の観点から利用しない方が良いでしょう。

したがって、該当ソフトウェアのバージョンアップ等による対応が必要となります。

これは少し大変な作業となります。

該当ソフトウェアのバージョンを単純に変えただけでは、WEBサイトの全ての機能が動くかわかりません。

アップデート後のバージョンではこれまでの機能が動かなくなることもあります。

その場合は新しいバージョン用にプログラムを改修する必要があります。

そして、バージョンアップ後、全ての機能が正常に動作するかについて、WEBサイトを全体的に試験して上げる必要があります。

利用OS、ソフトウェア等の脆弱性及びEOLについて対応する必要がある。

ハード故障について

WEBシステムはサーバ内のプログラムによって動いています。

このサーバについては、CPU、メモリ、ハードディスク等が搭載されたコンピュータになります。

長期間WEBサイトを稼働させた場合、こちらのコンピュータ(ハード)の故障が発生する場合があります。

ハードで故障が発生した場合、故障部品の交換、またはコンピュータ自体の入れ替えみたいなことを行い復旧しなければならないかもしれません。

こちらのハードの異常については、上記のアラートにて検知することができます。

(問題がある場合には、CPU等のハード側の監視結果に異常値が現れたり、監視情報が取得できなくなったりします)

ただ最近であれば、AWS等のクラウドサービスを利用してサーバを立てている場合が多い為、こちらはあまり気にしなくても良いかもしれません。

ハード自体が故障する場合もあるため、監視を行い、故障の場合は機器の交換等を実施する。

まとめ

WEBサイトを後悔したあとに、システムを安定的に動かすためにどのような事を行うのかについてお話してきました。

内容としては以下でしたね。

  • 今WEBサイトは正常に動いていますか?
  • WEBサイトのエラーについて
  • 脆弱性とEOL対策について
  • ハード故障について

基本的には、WEBサイトについては開発する期間よりも、公開してからの運用期間の方が長くなります。

この運用期間、WEBサイトを安定的に管理・運用していくことがとても大切ですね。

開発時とは違った観点でのシステムへの対応が求められます。

開発時に想定していなかったことも多々発生するでしょう。

WEBサイトを安定して動作させるために、本記事でお話した内容をしっかりと確認してWEBサイトのシステム運用を進めてもらえればと思います。

以上です。