How to set the sample rate (audio quality)

The speech_sample_rate parameter controls the audio quality and size of the generated output.

It is optional — if omitted, the default value is 24000 Hz (premium quality).

Supported values:

Sample Rate (Hz)	Audio Quality Description	Availability
8000	Basic telephony quality	All models & modes
16000	Good quality voice	All models & modes
22050	High-quality audio (default for v2)	All models & modes
24000	Premium audio quality (default for v3)	All models & modes
32000	Broadcast quality	bulbul:v3 REST API only
44100	CD quality audio	bulbul:v3 REST API only
48000	Professional/Studio quality	bulbul:v3 REST API only

Important: Sample rates above 24000 Hz (32000, 44100, 48000) are only available with bulbul:v3 via the REST API. They are not supported in streaming mode.

Example Code

Rest API

Streaming API

1 from sarvamai import SarvamAI
2 from sarvamai.play import save
3 
4 # Initialize the REST client
5 client = SarvamAI(api_subscription_key="YOUR_SARVAM_API_KEY")
6 
7 # Generate speech using REST
8 audio = client.text_to_speech.convert(
9     text="Welcome to Sarvam AI!",
10     model="bulbul:v3",
11     target_language_code="en-IN",
12     speech_sample_rate=24000  # Set premium audio quality
13 )
14 save(audio, "output1.wav")