Xiaomi MiMo-V2.5-TTS سيريز ۽ MiMo-V2.5-ASR جي لانچ سان گڏ پنهنجي MiMo وائس AI پليٽ فارم تي هڪ تازه ڪاري جو اعلان ڪيو آهي. ڪمپني بيان ڪري ٿي نئين لائين اپ کي مڪمل لنڪ وائس ماڊل سسٽم جي طور تي ايجنٽ جي دور لاءِ ٺهيل آهي، ٻنهي اسپيچ آئوٽ ۽ اسپيچ ان پٽ کي ڍڪيندي.

لانچ مارچ ۾ متعارف ڪرايل Xiaomi جي MiMo-V2-TTS ماڊل جي پيروي ڪري ٿو، جنهن ۾ ڍنگ، جذبات، ۽ ڳالهائڻ جي انداز تي تفصيلي ڪنٽرول تي ڌيان ڏنو ويو آهي.

Xiaomi MiMo-V2.5-TTS لائين اپ ۾ ٽي الڳ ماڊل شامل آهن ۽ Xiaomi جي MiMo اوپن پليٽ فارم ذريعي بغير قيمت جي محدود وقت لاءِ دستياب آهي.

بيس MiMo-V2.5-TTS ماڊل ۾ اڳواٽ آواز شامل آهن ۽ تقرير جي شرح، ڍنگ ۽ جذبات لاءِ ايڊجسٽمينٽ کي سپورٽ ڪري ٿو.

MiMo-V2.5-TTS-VoiceDesign صارفين کي هڪ مختصر ان پٽ جملي استعمال ڪندي مڪمل طور تي نئون آواز ٽمبر ٺاهڻ جي اجازت ڏئي ٿو.

MiMo-V2.5-TTS-VoiceClone مختلف ڳالهائڻ جي طرزن ۽ هدايتن تي مطابقت برقرار رکندي نموني جي هڪ ننڍڙي تعداد کي استعمال ڪندي هڪ مخصوص آواز کي ٻيهر پيدا ڪرڻ لاءِ ٺاهيو ويو آهي.

Xiaomi چيو ته ماڊل قدرتي ٻولي جي هدايتن جي تشريح ڪري سگھن ٿا بجاءِ ترتيب ڏنل پيرا ميٽرن جي ضرورت.

استعمال ڪندڙ بيان ڪري سگھن ٿا ته ڪيئن آواز کي سادي ٻولي ۾ آواز ڏيڻ گهرجي، جهڙوڪ آواز جي اداڪار کي هدايت ڪرڻ وانگر. سسٽم پڻ استعمال جي ڪيسن لاءِ پرت واري اسڪرپٽ طرز جي انپٽس کي سپورٽ ڪري ٿو جهڙوڪ راند جا ڪردار ۽ آڊيو ڊراما، ڪردار جي خاصيتن، منظرن، ۽ گفتگو جي الڳ ڪنٽرول جي اجازت ڏين ٿا.

ان لائن آڊيو ٽيگ پڻ سپورٽ ڪيا ويا آهن، صارفين کي جذبات کي ترتيب ڏيڻ يا هڪ جملي ۾ مخصوص نقطي تي پهچائڻ. اهي ٽيگ هڪ ئي متن ۾ ملائي سگهجن ٿا ۽ چيو وڃي ٿو ته چيني ۽ انگريزي ٻنهي ۾ ڪم ڪن.

Xiaomi پڻ جاري ڪري رهيو آهي MiMo-V2.5-ASR هڪ اوپن سورس اسپيچ ريڪگنيشن ماڊل طور.

ڪمپني چيو ته اها حقيقي دنيا جي منظرنامي لاءِ ٺهيل آهي جهڙوڪ ٻه لساني گفتگو، علائقائي ٻوليون، ۽ شور واري ماحول.

سپورٽ ٿيل چيني ٻولين ۾ وو، ڪينٽونيز، مننان، ۽ سيچواني شامل آهن. ماڊل چيني ۽ انگريزي جي وچ ۾ مٽائي سگھي ٿو بغير ڪنهن اڳئين ٻولي جي ٽيگ جي. اهو پڻ گيت جي غزلن کي سڃاڻي سگھي ٿو جيتوڻيڪ آوازن کي موسيقي سان ملايو ويندو آهي.

گڏجاڻين ۽ ملٽي اسپيڪر ماحول لاءِ، سسٽم ٺهيل آهي اوورليپنگ گفتگون کي اسپيڪر جي الڳ ٿيڻ سان نقل ڪرڻ لاءِ.

Xiaomi چيو ته اهو تيز شور سيٽنگون ۽ پري فيلڊ آڊيو ڪيپچر سان درستگي کي برقرار رکي سگهي ٿو.

MiMo-V2.5-ASR ۾ بلٽ ان فونٽيڪس ۽ سياق و سباق جي بنياد تي اوقاف شامل آهن، پوسٽ پروسيسنگ جي ضرورت کي گھٽائڻ.

Xiaomi چيو ته ماڊل اسٽيٽ آف دي آرٽ يا ويجھي اسٽيٽ آف دي آرٽ جا نتيجا ڏئي ٿو معيارن تي جيڪي ٻه لساني سڃاڻڻ، ڊوليڪ پروسيسنگ، ۽ ڪوڊ-سوئچنگ جا ڪم شامل آهن.

TTS ماڊل Xiaomi جي پليٽ فارم ذريعي دستياب آهن ۽ MiMo اسٽوڊيو ۾ آزمائي سگهجن ٿيون. ASR ماڊل دستياب آهي اوپن سورس وزن ۽ ڪوڊ سان سڌو استعمال يا ڪسٽمائيزيشن لاءِ.

📢 جديد ٽيڪنالاجي ۽ ٽيلي ڪام جي خبرن، وڊيوز ۽ تجزين لاءِ هاڻي ئي شامل ٿيو پروپاڪستاني جي WhatsApp گروپ!

گوگل نيوز تي پروپاڪستاني کي فالو ڪريو ۽ تيزيءَ سان پنهنجي پسنديده مواد ذريعي اسڪرول ڪريو!

شيئرز