Monitor LangChain Ollama APIs

To monitor Ollama calls, the Python Agent reports these metrics:

Input Tokens
Output Tokens
Time to first token metric (ms)
Time per output token (ms)
Average Response Time (ms)
Prompt count
Embedding queries count
Errors

Note:

For Token Metrics, ensure to install transformers Python library. See transformers.

CODE

pip install transformers

pip install transformers

Example metric path: Agent|Langchain|LLM|llama3.2_latest|Average Response Time (ms))

Splunk Enterprise

Splunk Cloud Platform

Splunkbase

Enterprise Security

SOAR

IT Service Intelligence

Content Packs

Splunk Observability Cloud

AppDynamics SaaS

AppDynamics On-Premises

Virtual Appliance (Self-Hosted)

Developer Documentation

Splunkbase

Splunk Enterprise

Splunk Cloud Platform

Splunkbase

DATA MANAGEMENT

SEARCH AND ANALYTICS

ADMINISTRATION

Enterprise Security

SOAR

ENTERPRISE SECURITY

SOAR

RELATED APPS

IT Service Intelligence

Content Packs

ITSI

IT Ops

ADMINISTRATION

EXTENSIONS

Splunk Observability Cloud

MONITORING

DATA MANAGEMENT

ADMINISTRATION

AppDynamics SaaS

AppDynamics On-Premises

Virtual Appliance (Self-Hosted)

ESSENTIALS

MONITORING

ADMINISTRATION

Developer Documentation

Splunkbase

PLATFORM

OBSERVABILITY

REFERENCE

Resources

REFERENCE

Learn More

Support

Monitor LangChain Ollama APIs