Models | Sarvam API Docs

Sarvam AI provides a purpose-built AI stack for building applications in Indian languages. Our models span speech-to-text, speech translation, text translation, and high-quality text-to-speech—designed specifically for India’s linguistic diversity, accents, and real-world usage patterns.

Each model is trained and evaluated on Indian languages and culturally grounded data, enabling higher accuracy in production scenarios. With simple, well-documented APIs and predictable performance, developers can build, deploy, and scale India-first AI experiences without managing model complexity.

New to building for Indian languages? Start with Building for Indian Languages — a practical guide to language coverage, code-mixing, scripts, native numerals, 8kHz telephony audio, and pronunciation control.

Model Selection Guide

Available models: Saaras v3 — Speech to Text, Bulbul v3 — Text to Speech, Mayura — Text Translation, Sarvam-Translate — Extended Translation, Sarvam-30B — Chat LLM, Sarvam-105B — Flagship Chat LLM, Sarvam Vision — Document Intelligence.

Saaras v3: Speech to Text

State-of-the-art ASR with 23 language support (22 Indian + English) and multiple output modes: transcribe, translate, verbatim, translit, codemix.

Bulbul v3: Text to Speech

Natural-sounding voices for 11 languages (10 Indian + English) with customizable pitch, pace, and speaker options.

Mayura: Text Translation

High-quality translation between 11 languages (10 Indian + English) with context preservation.

Sarvam-Translate: Text Translation

Extended translation support for all 23 languages (22 Indian + English) with superior accuracy.

Sarvam-30B: Chat LLM

30B parameter multilingual chat model delivering strong reasoning and conversational capabilities at a balanced performance-to-cost ratio.

Sarvam-105B: Flagship Chat LLM

105B parameter flagship model — our most capable chat model for the highest quality Indian language understanding, reasoning, and generation.

Sarvam Vision: Document Intelligence

Extract and digitize content from documents in 23 languages with accurate OCR and structured output.

Language Support Overview

Language coverage varies by model — check the table below before picking one. Full per-model tables are linked from each model’s own page.

Model	Languages	Status
Saaras v3 (Speech to Text)	23 (22 Indian + English) — full list	✅ Recommended
Sarvam Translate (Text Translation)	23 (22 Indian + English) — full list	✅ Active
Sarvam Vision (Document Intelligence)	23 (22 Indian + English) — full list	✅ Active
Bulbul v3 (Text to Speech)	11 (10 Indian + English) — full list	✅ Active
Mayura (Text Translation)	11 (10 Indian + English) — full list	✅ Active
Sarvam-30B (Chat LLM)	11 (10 Indian + English)	✅ Active
Sarvam-105B (Chat LLM)	11 (10 Indian + English)	✅ Active
Saarika v2.5 (Speech to Text, legacy)	11 (10 Indian + English) — same set as above	⚠️ Legacy

23-language set (Saaras v3, Sarvam Translate, Sarvam Vision)

Language	Code	Language	Code
Hindi	`hi-IN`	Assamese	`as-IN`
Bengali	`bn-IN`	Urdu	`ur-IN`
Kannada	`kn-IN`	Nepali	`ne-IN`
Malayalam	`ml-IN`	Konkani	`kok-IN`
Marathi	`mr-IN`	Kashmiri	`ks-IN`
Odia	`od-IN`	Sindhi	`sd-IN`
Punjabi	`pa-IN`	Sanskrit	`sa-IN`
Tamil	`ta-IN`	Santali	`sat-IN`
Telugu	`te-IN`	Manipuri	`mni-IN`
English	`en-IN`	Bodo	`brx-IN`
Gujarati	`gu-IN`	Maithili	`mai-IN`
		Dogri	`doi-IN`

11-language set (Bulbul v3, Mayura, Sarvam-30B/105B, Saarika v2.5)

Language	Code	Language	Code
Hindi	`hi-IN`	Kannada	`kn-IN`
Bengali	`bn-IN`	Malayalam	`ml-IN`
Tamil	`ta-IN`	Marathi	`mr-IN`
Telugu	`te-IN`	Punjabi	`pa-IN`
Gujarati	`gu-IN`	Odia	`od-IN`
English	`en-IN`

Use Cases

Voice Assistant

Content Localization

Call Center Analytics

Educational Platform

Document Processing

Build a multilingual voice assistant

Speech Input: Use Saaras v3 with mode="transcribe" to convert user speech to text
Understanding: Process with Sarvam-30B or Sarvam-105B for intelligent responses
Speech Output: Convert responses to speech with Bulbul

Perfect for customer service, smart home devices, and accessibility applications.

Learn how to build a voice agent with LiveKit →

Legacy Models

The following models are still available but are being phased out. We recommend migrating to the newer models listed above.

Sarvam-M: Chat & Reasoning (Deprecated)

24B parameter multilingual chat model with hybrid reasoning. Deprecated and no longer available through the API — migrate to Sarvam-30B or Sarvam-105B.

Saarika v2.5: Speech to Text

Legacy ASR model supporting 11 languages (10 Indian + English). Migrate to Saaras v3 for improved accuracy and 23-language support.

Saarika v2.5 Language Support (11 languages — 10 Indian + English)

Language	Code	Language	Code
Hindi	`hi-IN`	Kannada	`kn-IN`
Bengali	`bn-IN`	Malayalam	`ml-IN`
Tamil	`ta-IN`	Marathi	`mr-IN`
Telugu	`te-IN`	Punjabi	`pa-IN`
Gujarati	`gu-IN`	Odia	`od-IN`
English	`en-IN`