Friday, September 13, 2024

Gan.AI ने Myna-mini का अनावरण किया: बहुभाषी समर्थन के साथ टेक्स्ट-टू-स्पीच में क्रांतिकारी बदलाव

Share

संवादात्मक एआई शोध और उत्पादों में अग्रणी, Gan.AI, Myna-mini, एक अभिनव टेक्स्ट-टू-स्पीच (TTS) मॉडल और API के लॉन्च की घोषणा करते हुए रोमांचित है। यह अभूतपूर्व तकनीक भाषा प्रौद्योगिकी में एक महत्वपूर्ण मील का पत्थर है, जो अंग्रेजी के साथ-साथ सभी 22 आधिकारिक इंडिक भाषाओं का समर्थन करने वाला दुनिया का पहला TTS मॉडल है।

Gan.AI ने Myna-mini लॉन्च किया: अग्रणी टेक्स्ट-टू-स्पीच मॉडल जो अंग्रेजी के साथ-साथ 22 भारतीय भाषाओं को भी सपोर्ट करता है

मैना-मिनी की मुख्य विशेषताएं

मैना-मिनी में कई प्रभावशाली विशेषताएं हैं जो इसे टेक्स्ट-टू-स्पीच प्रौद्योगिकी की दुनिया में अलग बनाती हैं:

  • 22 भारतीय भाषाओं और अंग्रेजी के लिए समर्थन : विविध भाषाई आवश्यकताओं को पूरा करने के लिए व्यापक भाषाई कवरेज।
  • अनेक विशिष्ट आवाजें : विभिन्न आवाज विकल्पों के साथ भारत के विविध क्षेत्रों को प्रतिबिंबित करना।
  • मूल कोड-मिश्रित भाषा समर्थन : बहुभाषी इनपुट को सहजता से संभालता है, प्राकृतिक, संवादात्मक पाठ के लिए एकदम उपयुक्त।
  • उच्च गुणवत्ता, प्राकृतिक ध्वनि वाला ध्वनि आउटपुट : जीवंत श्रवण अनुभव के लिए बेहतर ध्वनि निष्ठा प्रदान करता है।
  • उपयोगकर्ता-अनुकूल एपीआई : डेवलपर्स के लिए आसान एकीकरण, सुचारू कार्यान्वयन सुनिश्चित करता है।
  • Gan.AI प्लेग्राउंड के माध्यम से निःशुल्क पहुंच : अत्याधुनिक तकनीक को बिना किसी लागत के आज़माएं।

कोड-मिश्रित समर्थन सुविधा, मैना-मिनी को एक ही वाक्य या पैराग्राफ में कई भाषाओं को संयोजित करने वाले पाठ को आसानी से संसाधित करने की अनुमति देती है, जो यह दर्शाता है कि लोग बातचीत के बीच में भाषाओं के बीच स्विच करके स्वाभाविक रूप से कैसे संवाद करते हैं।

Gan.ai परिचय वीडियो

अत्याधुनिक अनुसंधान और विकास

मैना-मिनी, Gan.AI की टीम द्वारा किए गए व्यापक शोध और विकास का उत्पाद है, जिसमें स्टैनफोर्ड, FAIR, IITs, BITS, सैमसंग, माइक्रोसॉफ्ट और एडोब रिसर्च जैसी प्रतिष्ठित संस्थानों और अग्रणी तकनीकी कंपनियों के विशेषज्ञ शामिल हैं। टीम ने सामूहिक रूप से AI के क्षेत्र में 1,000 से अधिक शोध उद्धरण प्राप्त किए हैं।

गन.एआई के संस्थापक और सीईओ सुव्रत ने कहा, “मैना-मिनी एआई को सभी के लिए सुलभ और उपयोगी बनाने की दिशा में एक महत्वपूर्ण कदम है, चाहे वे कोई भी भाषा बोलते हों।” “हम भाषा के अंतर को पाटने और 1 बिलियन से अधिक लोगों तक उन्नत वॉयस तकनीक लाने के लिए उत्साहित हैं।”

भविष्य की योजनाएं और नवाचार

मैना-मिनी का लॉन्च Gan.AI के लिए बस शुरुआत है। कंपनी के पास और भी उन्नत मॉडल के लिए महत्वाकांक्षी योजनाएँ हैं, जिनमें शामिल हैं:

  • मैना और मैना-लार्ज : प्रशिक्षण डेटा और पैरामीटर गणना के संदर्भ में दुनिया के सबसे बड़े टीटीएस मॉडल बनने के लिए तैयार।
  • जीरो-शॉट क्रॉस-लिंगुअल वॉयस क्लोनिंग : बिना अतिरिक्त प्रशिक्षण के विभिन्न भाषाओं में आवाजों को क्लोन करने की नवीन तकनीक।
  • लिप-सिंक एपीआई : अधिक यथार्थवादी एनिमेशन के लिए भाषण और होंठ आंदोलनों के समन्वय को बढ़ाना।
  • अवतार एपीआई : समकालिक भाषण और भावों के साथ जीवंत डिजिटल अवतार बनाना।

अग्रणी ब्रांडों द्वारा विश्वसनीय

Gan.AI की तकनीक ने पहले ही वीडियो और ऑडियो अभियानों को निजीकृत करने के लिए विश्व-प्रसिद्ध ब्रांडों का विश्वास प्राप्त कर लिया है, जिनमें उबर, कैडबरी, स्विगी, जोमैटो, सैन एंटोनियो स्पर्स और मुंबई इंडियंस शामिल हैं।

डेवलपर्स, शोधकर्ताओं और व्यवसायों को Gan.AI प्लेग्राउंड पर Myna-mini का पता लगाने के लिए आमंत्रित किया जाता है । Gan.AI भविष्य के विकास और सुधारों का मार्गदर्शन करने के लिए समुदाय से प्रतिक्रिया का स्वागत करता है।

मैना-मिनी के साथ टेक्स्ट-टू-स्पीच प्रौद्योगिकी के भविष्य का अन्वेषण करें और बहुभाषी संचार में क्रांति लाने के लिए Gan.AI से जुड़ें।

Read more

Local News