OpenAI API のモニタリング
AppDynamics Python エージェントは、OpenAI API の使用状況と関連メトリックをモニターするのに役立ちます。これは、OpenAI バックエンドへの openai-python ライブラリを使用して作成された ChatCompletion、Completion および Moderation API タイプの要求をモニターします。エージェントは、OpenAI API モデルによって使用されるプロンプトと応答もキャプチャします。
次のメトリックは、アプリケーション、階層、およびノードの各レベルで報告されます。
- 1分あたりのコール数
- 1分あたりのエラー数
- トークン
- 入力トークン = 0.5$
- 完了トークン = 1.5$
次に、メトリックパスの例を示します。
- モデルごとのメトリックパス -
Application Infrastructure Performance|OpenAI_Tier|OpenAI|ada|Cost - すべてのモデル累積メトリックパス -
Application Infrastructure Performance|OpenAI_Tier|OpenAI|Cost - All Models - ネット アプリケーション レベルのメトリックのパス -
Overall Application Summary|OpenAI - Cost - ada
OpenAI モデレーション API
バージョン 24.2.0 以降、Python エージェントでは OpenAI モデレーション API がサポートされます。モデレーション API は、クエリされたステートメントがポリシーに準拠しているかどうかをユーザーに求めます。Python エージェントでは、次のメトリックがキャプチャされます。
- モデレーション API へのコール:モデレーション API が使用された回数(1 分ごと)。(
OpenAI|moderations|Calls per minute) - フラグ付きカテゴリメトリクス:ヘイトスピーチなど、特定のタイプのコンテンツにフラグが付けられた回数。(
OpenAI|moderations|Flagged Calls by category|hate) - フラグ付きクエリカウント:フラグが設定されたコンテンツの合計数。(
OpenAI|moderations|Flagged queries) - 合計クエリカウント:処理されたクエリの総数。(
OpenAI|moderations|Total queries)
前提条件
AppDynamics を使用して OpenAI API exit コールをモニターするには、次の前提条件を満たしていることを確認します。
- Python エージェント 23.8.0 以降をインストールします。Pythonエージェントのインストール を参照してください。
- カスタムダッシュボードおよびテンプレートをインポートします。
- Python エージェントの ファイルで
enable-openaiフラグを必ず/path/to/appdynamics.cfgに設定してください。[instrumentation]を参照してください。 - スナップショット exit コールの詳細で OpenAI 要求および応答をキャプチャするには、Python エージェントの
/path/to/appdynamics.cfgファイルでenable-genai-data-captureフラグを true に設定します。「[instrumentation]」を参照してください。
カスタム ダッシュボードの作成
ダッシュボードの例
カスタムコストメトリック式の作成
入力トークンメトリックと完了トークンメトリックにそれぞれのコストを乗算することで、カスタムコストメトリック式を作成できます。
たとえば、gpt-3.5-turbo-0125 の 100 万トークンあたりのコストは次のとおりです。
- 入力トークン = 0.5$
- 完了トークン = 1.5$
gpt-3.5-turbo-0125 のカスタム式を作成して、次のようにコストを計算できます。({input Tokens}*0.5 + {Completion Tokens}*1.5)/1000000このカスタム式を使用して、さまざまなモデル間のコスト分散の円グラフ、またはすべてのモデルのコスト関数を含む総コストウィジェットを作成します。次の手順を実行して、既存の OpenAI ダッシュボードにモデルごとのコストウィジェットを作成します。
このメトリック式には、両方のタイプに対する 100 万トークンあたりのコスト乗数が含まれます。