ネットワーク機器の監視を始めると、ほぼ確実に出てくるのが「SNMP監視」です。

しかし初心者の方は、

  • SNMPって何をしているの?
  • Ping監視と何が違う?
  • Zabbixでどう設定するの?
  • OIDって何?
  • なぜ値が取得できないの?

このあたりで止まりやすいです。

特に実務では、

「疎通監視はできているのにSNMPだけ取得できない」

というトラブルが非常に多いです。

この記事では、Zabbix を使ったSNMP監視設定について、初心者向けに丁寧に解説します。

単なる設定手順だけではなく、

  • なぜSNMP監視を使うのか
  • どこで詰まりやすいのか
  • 実務では何に注意するのか

まで含めて説明します。

これから監視運用を始める新人エンジニアの方でも、実際に設定できるレベルを目指します。

SNMP監視とは何か

SNMPの基本

SNMPは「Simple Network Management Protocol」の略です。
ネットワーク機器の状態を取得するための通信プロトコルです。

主に以下の機器監視で使われます。

  • ルータ
  • スイッチ
  • Firewall
  • UPS
  • プリンタ
  • ストレージ機器

Linuxサーバ監視ではエージェント監視が多いですが、ネットワーク機器ではSNMP監視が一般的です。

なぜSNMP監視が必要なのか

結論から言うと、

「ネットワーク機器はエージェントを入れられないことが多い」

からです。

例えばL2スイッチにZabbix Agentは通常インストールできません。
そのため、SNMPを使って外部から情報取得します。

取得できる情報の例です。

  • CPU使用率
  • メモリ使用率
  • ポート通信量
  • 温度
  • 電源状態
  • FAN異常

障害の予兆監視にも使われます。

Ping監視との違い

初心者が最初に混乱しやすいポイントです。

監視方式確認できる内容
Ping監視生存確認
SNMP監視詳細な状態確認

Pingだけでは、

「機器が重い」

ことは分かりません。

SNMPなら、

  • CPU高騰
  • ポートエラー
  • 温度異常

まで確認できます。

ずきんちゃん

Ping応答があれば問題ない気がするんだけど…?

ぬこさま

実務では「応答はあるけど遅い」障害が多いんだよ。CPU100%でもPingは返ることがある。だからSNMP監視が必要なんだ。

ZabbixでSNMP監視を行う構成

必要な機器

最低限必要なのは以下です。

  • Zabbix Server
  • SNMP対応機器
  • ネットワーク疎通

監視対象機器側でSNMPを有効化する必要があります。

SNMP v2cとv3の違い

初心者はまずv2cから覚えれば大丈夫です。

バージョン特徴
SNMP v2c設定が簡単
SNMP v3認証・暗号化あり

実務ではまだv2cも多いですが、セキュリティ重視環境ではv3が推奨されます。

実務でよく使われる構成

よくある構成です。

Zabbix Server
   ↓ UDP161
L2/L3 Switch

SNMPはUDP161番ポートを使用します。

ここをFirewallで閉じてしまい、取得失敗するケースが非常に多いです。

ZabbixでSNMP監視を設定する手順

SNMPを有効化する

まず監視対象機器側でSNMPを有効化します。

Cisco系機器の例です。

snmp-server community public RO

RO はRead Onlyです。

監視だけなら通常はこちらを使用します。

Zabbixへホスト登録する

Zabbix画面から以下を設定します。

  • ホスト名
  • グループ
  • SNMPインターフェース

ここでIPアドレスを間違えるケースがかなり多いです。
特に管理IPではなく業務NW側IPを入れてしまうミスがよくあります。

SNMPインターフェースを設定する

ホスト設定画面で、

  • Type:SNMP
  • IP:対象機器IP
  • Port:161

を設定します。

Communityには機器側設定と同じ値を入れます。

例:

public

テンプレートを適用する

ZabbixにはSNMP用テンプレートがあります。

例えば:

  • Template Net Cisco IOS SNMP
  • Template Module Interfaces SNMP

テンプレートを使う理由は、

「OIDを手動登録しなくて済む」

ためです。

実務でも基本はテンプレート利用が中心です。

監視データを確認する

設定後は以下を確認します。

  • Latest data
  • Graphs
  • Problems

取得できない場合は、まず疎通確認を行います。

snmpwalk -v2c -c public 192.168.1.1

ここで応答が返らない場合、Zabbix以前の問題です。

OIDとは何か

OIDの役割

OIDはSNMPで情報取得するための識別子です。

例えば、

1.3.6.1.2.1.1.3.0

のような形式です。
初心者が最初に苦戦しやすい部分です。

よく使うOID例

監視項目OID例
uptime1.3.6.1.2.1.1.3.0
interface trafficIF-MIB
CPU使用率ベンダ依存

CPU監視OIDはメーカーごとに異なることがあります。
ここは実務でも詰まりやすいです。

snmpwalkで確認する

実務では snmpwalk をよく使います。

snmpwalk -v2c -c public 192.168.1.1

これで取得可能なOID一覧を確認できます。

ずきんちゃん

OIDが多すぎて何を見ればいいか分からない…

ぬこさま

最初はテンプレート利用で大丈夫。実務でも全部暗記してる人は少ないよ。必要になった時に調べることが多い。

Zabbixの実務でよくあるSNMP監視トラブル

Timeoutになる

最も多いです。

原因例:

  • UDP161閉塞
  • ACL制限
  • Community不一致
  • SNMP無効

特にFirewall忘れは実務で本当に多いです。

値が取得できない

OID誤りが多いです。

メーカー独自OIDの場合があります。

また、古い機器ではOID仕様が異なることもあります。

SNMP version不一致

v2c設定なのにv3でアクセスしているケースです。

設定値を必ず揃えます。

FirewallでUDP161が閉じている

初心者がかなりハマります。

SNMPはTCPではなくUDPです。

そのため、

「TCPは許可済みだから大丈夫」

と思い込みやすいです。

SNMP監視で運用負荷を減らす考え方

監視項目を増やしすぎない

初心者ほど全部監視したくなります。

ですが実務では、

「アラート対応できる項目だけ監視する」

が重要です。

監視しすぎると、

  • アラート過多
  • 誤検知増加
  • 運用疲弊

につながります。

不要なポーリングを避ける

SNMPは定期的に取得します。

取得間隔を短くしすぎると、

  • 機器負荷
  • Zabbix負荷

が増えます。

CPUや温度監視を1秒単位で取得する必要は通常ありません。

誤検知を減らす

通信量監視では瞬間的なスパイクがあります。

そのため、

  • 平均値利用
  • 閾値調整
  • 継続時間条件

を設定します。

ここは実務でかなり重要です。

実務でよく監視するSNMP項目

CPU使用率

高負荷状態を検知します。
継続的に高い場合は性能問題の可能性があります。

メモリ使用率

メモリリーク検知で使います。
ただし一時的上昇だけでアラートにすると誤検知が増えます。

インターフェース帯域

ネットワーク監視で非常に重要です。
輻輳調査でよく確認されます。

温度監視

データセンター機器では重要です。
特に夏場は温度アラートが増えやすいです。

まとめ

ZabbixのSNMP監視は、ネットワーク監視では基本になる技術です。

特に実務では、

  • CPU使用率
  • 帯域監視
  • 温度監視
  • ポート状態監視

などで頻繁に利用されます。

一方で初心者は、

  • OID
  • UDP161
  • Community
  • SNMP version

で詰まりやすいです。

まずはテンプレートを使いながら、

  • SNMP通信確認
  • snmpwalk
  • Zabbixデータ確認

の流れを理解するのがおすすめです。

ABOUT ME
はつゆき
はじめまして、はつゆきと申します。 なんやかんやでシステムエンジニアとして10年務めています。 特に監視系やサーバ関連などを多く携わっています。 初めて監視系の案件に携わるよーって方へなるべくわかってもらえるようにこれまで経験してきたことなど伝えていければと思っています。