TCP Connection Metrics in Metric Browser
- TCP flow setup/teardown times and errors
- Distribution of TCP flows for an element by throughput, setup time, lifetime, and round-trip time
- Flows closed by TCP resets
- Distribution of flows based on TCP configuration options (Selective Acknowledgement, Timestamp)
- For these metrics, the Metric Browser uses the terms Connection and Flow interchangeably. See Flows, Links, and Connections.
- Network Agents do not collect metrics for individual Connections by default. The recommended workflow is to enable TCP Flow metric collection only when you need to diagnose a performance issue on an associated node or Connection. See Dynamic Monitoring Mode and Network Visibility.
Viewing TCP Flow Metrics
To view advanced network metrics, open the Metric Browser and navigate to Application Infrastructure Performance. The Metric Browser shows connection/flow metrics for the following aggregations (highlighted in red):
-
Application Infrastructure Performance >
-
Advanced Network >
-
Flows >
- All Connections/Flows for Application
-
Flows >
-
tier-name
-
Advanced Network >
-
Flows >
- Call from<tier>to<service>
- Call from<node>to<node-or-service>
- Individual Connection/Flow(<node> to <service>)
- All Connections/Flows for Network Link(<tier> to <service>)
- Call from<node>to<node-or-service>
- All Connections/Flows for tier
- Call from<tier>to<service>
-
Flows >
-
Advanced Network >
-
Advanced Network >
TCP フローのメトリックの説明
| デフォルトのモニタリングモード | ||
|---|---|---|
|
# Client Limited |
クライアントノードが送信した TCP ウィンドウの更新の数。これは、クライアントノードが、アプリケーションが処理できるレートよりも速いレートでデータを受信していることを示します | KPI |
|
# Client Zero Window |
クライアントの TCP バッファがいっぱいになると、クライアントは TCP 受信ウィンドウサイズとしてゼロを送信し、それ以上データを受信できないことを示します。その後、クライアントがそのバッファ内のデータを処理できるようになるまでデータ転送は停止します。 クライアントの TCP ゼロウィンドウメッセージの発生率が高い場合、次のいずれかに問題があります。
| KPI |
|
接続エラー |
Syn Resets + Syn Blackholes + TCP Resets - Established の合計 | KPI |
|
# Connection Requests | 選択した時間枠の間に送信された接続要求(成功および失敗)の合計数 | KPI |
|
# Current Established Connections | 確立された(セットアップされた)フロー/接続の数 | KPI |
|
# Data Retransmits | すべての TCP 接続で再送信された TCP データパケットの数 | KPI |
|
# Delayed Acks (Data Piggy Back) | ACK(確認応答)を別のメッセージに「ピギーバック」することによって、受信ノードが ACK を送信した平均回数 | Advanced |
|
# Delayed Acks (Timeouts) |
遅延 ACK(確認応答)タイマーが期限切れになったために、受信ノードが ACK を送信した平均回数 これは、遅延 ACK アルゴリズムの「最悪の場合」の遅延であり、送信側ノードと受信側ノードで、それぞれ Nagle アルゴリズムと遅延 ACK が有効になっている場合に最もよく発生します。遅延 ACK のレートが高くなると、接続の平均遅延に非常に大きな影響が及ぶ可能性があります。 | Advanced |
|
# Errors | 接続のセットアップのエラー(SYN エラー)または接続の切断のエラー(FIN エラー)を示す送信された TCP メッセージの数 | KPI |
|
# Fin Errors |
接続の切断中に生成されたエラーの数(TCP FIN エラー)。FIN 待機状態の接続の数が多いと、新しい接続の作成が遅延する可能性があります。 | KPI |
|
# Flows (<1KB) # Flows (1k - 10k) # Flows (10k - 100k) # Flows (100k-1MB) # Flows (1MB - 10MB) # Flows (>10MB) |
これらのメトリックを使用して、スループット別にフローの分布を分析します | Advanced |
|
# Flows - Handshake (1SD) # Flows - Handshake (2SD) # Flows - Handshake (3SD) | 接続セットアップ時間がその接続グループの平均よりも 1、2、または 3 標準偏差だけ高いまたは低い TCP フローの数 理想的な条件下では、すべてのフローが平均の 1SD 以内になります | Advanced |
|
# Flows - Lifetime (1SD) # Flows - Lifetime (2SD) # Flows - Lifetime (3SD) | 有効期間が平均よりも 1、2、または 3 標準偏差だけ高い、または低い TCP フローの数。 理想的な条件下では、すべてのフローが平均の 1SD 以内になります。2SD または 3SD のフローは、ネットワークパスに従った一貫性のないフロー処理を示します。これらの一貫性のなさは、ネットワークサービスが使用可能な帯域幅を意図的に減らしている場合(帯域幅のスロットリング)、または一部のタイプのトラフィックを他のタイプのトラフィックよりも優先している場合(トラフィックシェービング)に発生します。 短時間の接続は、断続的に発生している場合でも、調査の必要がある問題を示している可能性があります。短時間の接続が多く生成されるほど、それらの接続のセットアップと切断に費やされるリソースが多くなります。 | Advanced |
|
# Flows - RTT (1SD) # Flows - RTT (2SD) # Flows - RTT (3SD) |
ラウンドトリップ時間が、親グループ内のすべてのフローの平均よりも 1、2、または 3 標準偏差だけ高いフローの数。理想的な条件下では、すべてのフローが平均の 1SD 以内になります。 RTT が高い接続は、断続的に発生している場合でも、調査の必要がある問題を示している可能性があります。e-コマース Web アプリケーションの平均応答時間が 2 秒(許容範囲内)であるにもかかわらず、トランザクションの 5% が 20 秒以上(許容範囲外)である場合、非常に多くの顧客が不満を感じ、収益が失われる可能性があります。 | Advanced |
|
# Flows - TCP Data Rxmt | パケットが再送信されたフローの数。再送信は、パケットの損失を示します。 | Advanced |
|
# Flows - TCP Resets |
TCP リセットによって終了したフローの平均数 | KPI |
|
# Flows - w/o TCP SACK |
TCP 選択的確認応答(SACK)オプションが無効になっているフローの数。SACK が有効になっている場合、受信側は、セグメントが失われた場合に複数のデータパケットの受信に対して確認応答するために SACK パケットを送信できます。これにより、再送信の回数を削減され、ネットワークのパフォーマンスが向上します。SACK が無効になっている場合、受信側は、ピアがパケットを受信した場合でも、セグメントが最後に失われた後にすべてのパケットを再送信する必要があります。 | Advanced |
|
# Flows - w/o TCP Timestamp | TCP タイムスタンプオプションが無効になっているフローの数。このオプションは、より正確なラウンドトリップ時間を計算するために使用します。 | Advanced |
|
# IP Fragment Count | この TCP 接続グループの IP フラグメント属性の合計数。高いレベルのフラグメンテーションは、ネットワークの問題を示していて、アプリケーションのパフォーマンスに深刻な影響を与える可能性があります。 | KPI |
|
# Loss Pkts | 失われた(送信されたが受信されなかった)パケットの合計数 | Advanced |
|
# Nagle Delays |
送信側ノードが、前に送信したデータの確認応答(ACK)を待機する必要があったために、メッセージ送信イベントが遅延した回数。これは、送信側ノードと受信側ノードで、それぞれ Nagle アルゴリズムと遅延 ACK が有効になっている場合に最もよく発生します。 | Advanced |
|
# PIE Events |
パフォーマンスに影響する要素(PIE)は、実際のボトルネックまたは潜在的なボトルネックの場所を特定するために使用します。
| KPI |
|
# RetransmissionTimeouts |
再送信タイムアウト(RTO)は、ネットワークパケット損失を示しています。これにより、TCP 再送信タイマー(データの確認応答を確認するためのタイマー)の期限が切れたときにデータが再送信されます
| KPI |
|
# SACK Retransmits | パケットの未受信を示す SACK メッセージが原因で再送信されたパケットの平均数 | KPI |
|
# Server Limited |
サーバノードが送信した TCP ウィンドウの更新の数。これは、サーバノードが、アプリケーションが処理できるレートよりも速いレートでデータを受信していることを示します | KPI |
|
# Server Zero Window |
サーバの TCP バッファがいっぱいになると、サーバは TCP 受信ウィンドウサイズとしてゼロを送信し、それ以上データを受信できないことを示します。その後、サーバがそのバッファ内のデータを処理できるようになるまでデータ転送は停止します。 サーバの TCP ゼロウィンドウメッセージの発生率が高い場合、次のいずれかに問題があります。
| KPI |
|
# Syn Blackholes |
応答がなかったために失敗となった接続試行の回数。Syn blackholes は、アプリケーションのパフォーマンスに深刻な影響を与える可能性があります。 | KPI |
|
# Syn Resets |
他のホストによって明示的に拒否された接続試行の数。Syn resets は、アプリケーションのパフォーマンスに深刻な影響を与える可能性があります。 | KPI |
|
# TCP Resets - Established |
確立された TCP フローがリセットされた平均回数 | KPI |
|
# TCP Resets - Fin | TCP フローが終了のプロセス中にリセットされた平均回数 | KPI |
|
# TTL Changes (1 - 2 hops) # TTL Changes (3 - 4 hops) # TTL Changes (>=5 hops) |
この接続で発生したルーティングホップの変更の数。ルーティングホップが頻繁に変更される場合、ネットワークのルーティングの問題を示していて、アプリケーションのパフォーマンスに深刻な影響を与える可能性があります。 理想的な条件下では、ホップ数は一貫します。 | Advanced |
|
Avg # TTL Hops | この接続で発生したルーティングホップの変更の平均数 | 詳細設定 |
|
Delayed Acks Lag (usec) | 接続の全体的な遅延に対して遅延 ACK が追加する遅延の平均量 | Advanced |
|
Initial RTT (usec) |
最初の 2 つの SYN パケットのラウンドトリップ時間(エージェントがクライアントとサーバのどちらで実行されているかに応じて、SYN と SYN-ACK の間、または SYN-ACK と ACK の間のラウンドトリップ時間) | KPI |
|
Latency - RTT (usec) |
すべてのパケットの平均ラウンドトリップ遅延(パケット伝送から確認応答まで) | KPI |
|
Lifetime (usec) | 接続グループ内の TCP セッションの平均ライフタイム(初期セットアップから最終切断まで) | KPI |
|
Loss (per mille) | 送信された 1000 パケットのうち失われたパケットの数。「Per mille(1000 分の 1)」は、1 つ桁が追加され精度が向上したパーセンテージです。 | KPI |
|
Nagle Delays Lag (usec) | 接続の全体的な遅延に対して Nagle 遅延が追加する遅延の平均量 | Advanced |
|
Pkts per Sec | 送受信されたパケットの平均レート | KPI |
|
Rx Pkts per Sec | 受信パケットの平均レート | Advanced |
|
Rx Throughput (BPS) | 受信されたバイトの平均レート | Advanced |
|
TCP Handshake (usec) |
親グループのすべてのフローに対する、最初の 3 ウェイ接続セットアップのラウンドトリップ時間。
| KPI |
|
Throughput (BPS) | すべての TCP セッションの対象アプリケーションのスループット(1 秒あたりのバイト数) | KPI |
|
Tx Pkts per Sec | 送信されたパケットのレート | Advanced |
|
Tx Throughput (BPS) | 受信されたトラフィックのレート | 詳細設定 |