बुलबुल-वी2

प्रश्न – निम्नलिखित में से कौन-सा तथ्य सही नहीं है?
(a) बुलबुल-वी2 मॉडल 11 भारतीय भाषाओं में प्राकृतिक और क्षेत्रीय उच्चारण वाली आवाज़ें प्रदान करता है।
(b) बुलबुल-वी2 की P90 विलंबता 0.945 सेकंड है।
(c) सर्वम एआई का यह मॉडल 10,000 अक्षरों के लिए 15 रुपये में सेवा प्रदान करता है।
(d) बुलबुल-वी2 मॉडल प्रतिस्पर्धी ElevenLabs की तुलना में पाँच गुना सस्ता है।
उत्तर – (b)


व्याख्यात्मक उत्तर

  • मई, 2025 में बेंगलुरु स्थित एआई स्टार्टअप सर्वम एआई ने बुलबुल-वी2 नाम से एक नया टेक्स्ट-टू-स्पीच एआई मॉडल लॉन्च किया है।
  • यह हिंदी, मराठी, पंजाबी, उड़िया, तमिल, बंगाली, तेलुगु, कन्नड़, मलयालम और गुजराती सहित 11 भारतीय भाषाओं में उपलब्ध है।
  • यह मॉडल 11 भारतीय भाषाओं में प्राकृतिक, मानवीय जैसी आवाज़ें और प्रामाणिक क्षेत्रीय उच्चारण प्रदान करता है।
  • यह मॉडल क्षेत्रीय उच्चारणों को सटीकता से पकड़ता है, जिससे आवाज़ें अधिक वास्तविक और स्थानीय प्रतीत होती हैं।
  • बुलबुल-वी2 की P90 विलंबता केवल 0.398 सेकंड है, जो प्रतिस्पर्धी ElevenLabs की 0.945 सेकंड से काफी तेज़ है।
  • सर्वम एआई का यह मॉडल 10,000 अक्षरों के लिए 15 रुपये में सेवा प्रदान करता है, जो कि ElevenLabs की तुलना में पाँच गुना सस्ता है।
  • यह बहुभाषी और कोड-मिश्रित पाठ, वास्तविक समय संश्लेषण क्षमताओं का समर्थन करता है, तथा पिच, गति और प्रबलता पर सूक्ष्म नियंत्रण भी प्रदान करता है।
  • यह मॉडल उपयोगकर्ताओं को 8kHz से 24kHz तक की रेंज में कई नमूना दरें प्रदान करता है।
  • सर्वम एआई को भारत सरकार द्वारा इंडियाएआई मिशन के तहत भारत का पहला स्वदेशी लार्ज लैंग्वेज मॉडल (LLM) विकसित करने के लिए चुना गया है।

लेखक- विजय प्रताप सिंह

संबंधित लिंक भी देखें…

https://indianexpress.com/article/technology/artificial-intelligence/sarvam-ai-launches-bulbul-v2-its-voice-model-with-support-for-11-indian-languages-9988752

https://www.thehindu.com/sci-tech/technology/sarvam-ai-launches-ai-text-to-speech-model-with-support-for-11-indian-languages/article69548709.ece