Version: 1.0.x

Nvidia TTS

The Nvidia TTS provider enables your agent to use Nvidia's Riva text-to-speech models for converting text responses to natural-sounding audio output with low latency.

Installation

Install the Nvidia-enabled VideoSDK Agents package:

pip install "videosdk-plugins-nvidia"

Authentication

The Nvidia plugin requires an Nvidia API key.

Set NVIDIA_API_KEY in your .env file.

Importing

from videosdk.agents.plugins import NvidiaTTS

Example Usage

from videosdk.agents.plugins import NvidiaTTS
from videosdk.agents import Pipeline

# Initialize the Nvidia TTS model
tts = NvidiaTTS(
    # When NVIDIA_API_KEY is set in .env - DON'T pass api_key parameter
    api_key="your-nvidia-api-key",
    voice_name="Magpie-Multilingual.EN-US.Aria",
    language_code="en-US",
    sample_rate=24000
)

#  Add tts to cascade
pipeline = Pipeline(tts=tts)

note

When using .env file for credentials, don't pass them as arguments to model instances or context objects. The SDK automatically reads environment variables, so omit api_key and other credential parameters from your code.

Configuration Options

api_key: Your Nvidia API key (required, can also be set via environment variable)
server: The Nvidia Riva server address (default: "grpc.nvcf.nvidia.com:443")
function_id: The specific function ID for the service (default: "877104f7-e885-42b9-8de8-f6e4c6303969")
voice_name: (str) The voice to use (default: "Magpie-Multilingual.EN-US.Aria")
language_code: (str) Language code for synthesis (default: "en-US")
sample_rate: (int) Audio sample rate in Hz (default: 24000)
use_ssl: (bool) Enable SSL connection (default: True)

Additional Resources

The following resources provide more information about using Nvidia Riva with VideoSDK Agents SDK.

Nvidia Riva docs: Nvidia Riva documentation.

SDK Reference

GitHub Repository

Python Package

Got a Question? Ask us on discord

Installation​

Authentication​

Importing​

Example Usage​

Configuration Options​

Additional Resources​