Apache Spark
Apache Spark モニターには、この Splunk Observability Cloud インテグレーションを使用してください。メリット、インストール、設定、メトリクスを参照してください
Splunk Distribution of OpenTelemetry Collector は、Apache Spark モニタータイプの Smart Agent レシーバーを使用して Apache Spark クラスターを監視します。Spark Structured Streaming からのメトリクスの取得はサポートしていません。
以下のクラスター・モードでは、インテグレーションはHTTPエンドポイントのみをサポートします:
-
スタンドアロン
-
Mesos
-
Hadoop YARN
この collectd プラグインは、Kubernetes クラスターモードと互換性がありません。プライマリプロセスとワーカープロセスに対して個別のモニター設定と検出ルールを選択する必要があります。プライマリの設定には、isMaster を true に設定します。Hadoop YARN で Apache Spark を実行する場合、このインテグレーションで報告できるのはプライマリノードからのアプリケーションメトリクスのみです。
このインテグレーションはLinuxでのみ利用できます。
メリット
インテグレーションを設定すると、これらの機能にアクセスできるようになります:
-
メトリクスを表示します。独自のカスタムダッシュボードを作成することができ、ほとんどのモニターは組み込みのダッシュボードも提供しています。ダッシュボードの詳細については、「Splunk Observability Cloudでダッシュボードを表示する」を参照してください。
-
Infrastructure Monitoring に表示される環境内の物理サーバー、仮想マシン、AWS インスタンス、およびその他リソースのデータ駆動型の視覚化を表示します。ナビゲータの詳細については、「Splunk Infrastructure Monitoring でナビゲーターを使用する」を参照してください。
-
Metric Finder へアクセスし、モニターから送信されたメトリクスを検索します。詳細は、「メトリクス・ファインダーとメタデータ・カタログを検索する」を参照してください。
インストール
このインテグレーションを導入するには、以下の手順に従ってください:
-
Splunk Distribution of OpenTelemetry Collector をホストまたはコンテナプラットフォームにデプロイします:
-
設定のセクションで説明するように、モニターを設定します。
-
Splunk Distribution of OpenTelemetry Collector を再起動します。
設定
Smart Agent モニターとCollector のインテグレーションを使用するには、以下の手順に従います:
-
Smart Agent レシーバーを設定ファイルに含めます。
-
レシーバーセクションおよびパイプラインセクションの両方で、Collector 構成にモニタータイプを追加します。
-
「Collector でSmart Agent モニターを使用する」を参照してください。
-
Smart Agent レシーバーの設定方法を参照してください。
-
一般的な構成オプションのリストについては、「モニターの共通設定」を参照してください。
-
Collector の詳細については、「はじめに:Collector を理解して使用する」を参照してください。
-
例
このインテグレーションを有効にするには、Collector の構成に次のいずれかを追加します:
receivers:
smartagent/collectd_spark_master:
type: collectd/spark
... # Additional config
receivers:
smartagent/collectd_spark_worker:
type: collectd/spark
... # Additional config
次に、設定ファイルの service.pipelines.metrics.receivers セクションにモニターを追加します:
service:
pipelines:
metrics:
receivers: [smartagent/collectd_spark_master]
service:
pipelines:
metrics:
receivers: [smartagent/collectd_spark_worker]
collectd_spark_master および collectd_spark_worker は識別のみを目的としており、機能には影響しません。設定ではいずれかの名前を使用できますが、プライマリプロセスとワーカープロセスで個別のモニター設定と検出ルールを選択する必要があります。プライマリ構成については、構成設定セクションの isMaster フィールドを参照してください。コンフィギュレーション設定
次の表に、このインテグレーションの設定オプションを示します:
|
オプション |
必須 |
タイプ |
説明 |
|---|---|---|---|
|
|
いいえ |
| このオプションは、Pythonコードを実行するPythonバイナリへのパスを指定 します。このオプションを設定しない場合、システムは組み込みランタイムを使用します。また、バイナリへの引数を含めることができます。 |
|
|
〇 |
| |
|
|
〇 |
| |
|
|
いいえ |
| プライマリを監視する場合は、このオプションを true に設定します。Spark ノード。デフォルトは |
|
|
はい |
| このオプションは、監視しているクラスターのタイプに設定します。値は、
|
|
|
いいえ |
|
デフォルトは |
|
|
いいえ |
|
デフォルトは |
メトリクス
これらは、このインテグレーションで利用可能なメトリクスです:
https://raw.githubusercontent.com/signalfx/splunk-otel-collector/main/internal/signalfx-agent/pkg/monitors/collectd/spark/metadata.yaml
備考
-
Splunk Observability Cloud で利用可能なメトリクスタイプの詳細は、「メトリクスタイプ」を参照してください。
-
ホストベースのサブスクリプションプランでは、デフォルトのメトリクスは、ホスト、コンテナ、バンドルメトリクスなど、Splunk Observability Cloud のホストベースのサブスクリプションに含まれるメトリクスです。カスタムメトリクスはデフォルトでは提供されていないため、料金が発生する場合があります。詳細については、「メトリクスカテゴリ」を参照してください。
-
MTSベースのサブスクリプションプランでは、すべてのメトリクスがカスタムです。
-
メトリクスを追加するには、「その他のメトリクスの追加」で
extraMetricsの設定方法を参照してください。
トラブルシューティング
__ ___ ___ _ ______ _____________ _____ ________ ___ ___ ___ ____ __ ___ ____ ____ __ ______ _____________ ______ ___ ___ ___ ____ __ ___ _________ _____
_________ __ ______ _____________ _____ _________
-
______ _ ____ __ ___ ______ _______ _______
-
_______ ______ ________
_________ __ ___________ _________ ___ ____ _____ _____
-
___ _ ________ ___ ___ _______ _______ _________ _______ __ ______ ________
-
____ ___ ______ ______________ ____ _____ _____ _______ __ ___________ ____ __________ _________ ___ ______ _________ __________ __ _____ ___ ____ _______