प्रश्न – निम्नलिखित में से कौन-सा तथ्य सही नहीं है?
(a) बुलबुल-वी2 मॉडल 11 भारतीय भाषाओं में प्राकृतिक और क्षेत्रीय उच्चारण वाली आवाज़ें प्रदान करता है।
(b) बुलबुल-वी2 की P90 विलंबता 0.945 सेकंड है।
(c) सर्वम एआई का यह मॉडल 10,000 अक्षरों के लिए 15 रुपये में सेवा प्रदान करता है।
(d) बुलबुल-वी2 मॉडल प्रतिस्पर्धी ElevenLabs की तुलना में पाँच गुना सस्ता है।
उत्तर – (b)
व्याख्यात्मक उत्तर
- मई, 2025 में बेंगलुरु स्थित एआई स्टार्टअप सर्वम एआई ने बुलबुल-वी2 नाम से एक नया टेक्स्ट-टू-स्पीच एआई मॉडल लॉन्च किया है।
- यह हिंदी, मराठी, पंजाबी, उड़िया, तमिल, बंगाली, तेलुगु, कन्नड़, मलयालम और गुजराती सहित 11 भारतीय भाषाओं में उपलब्ध है।
- यह मॉडल 11 भारतीय भाषाओं में प्राकृतिक, मानवीय जैसी आवाज़ें और प्रामाणिक क्षेत्रीय उच्चारण प्रदान करता है।
- यह मॉडल क्षेत्रीय उच्चारणों को सटीकता से पकड़ता है, जिससे आवाज़ें अधिक वास्तविक और स्थानीय प्रतीत होती हैं।
- बुलबुल-वी2 की P90 विलंबता केवल 0.398 सेकंड है, जो प्रतिस्पर्धी ElevenLabs की 0.945 सेकंड से काफी तेज़ है।
- सर्वम एआई का यह मॉडल 10,000 अक्षरों के लिए 15 रुपये में सेवा प्रदान करता है, जो कि ElevenLabs की तुलना में पाँच गुना सस्ता है।
- यह बहुभाषी और कोड-मिश्रित पाठ, वास्तविक समय संश्लेषण क्षमताओं का समर्थन करता है, तथा पिच, गति और प्रबलता पर सूक्ष्म नियंत्रण भी प्रदान करता है।
- यह मॉडल उपयोगकर्ताओं को 8kHz से 24kHz तक की रेंज में कई नमूना दरें प्रदान करता है।
- सर्वम एआई को भारत सरकार द्वारा इंडियाएआई मिशन के तहत भारत का पहला स्वदेशी लार्ज लैंग्वेज मॉडल (LLM) विकसित करने के लिए चुना गया है।
लेखक- विजय प्रताप सिंह
संबंधित लिंक भी देखें…
