Xiaomi خپل MiMo غږ AI پلیټ فارم ته د MiMo-V2.5-TTS لړۍ او MiMo-V2.5-ASR په لاره اچولو سره تازه اعلان کړی. شرکت نوی لاین اپ د بشپړ لینک غږ ماډل سیسټم په توګه تشریح کوي چې د اجنټ دورې لپاره ډیزاین شوی ، د وینا محصول او وینا ان پټ دواړه پوښي.
لانچ د Xiaomi MiMo-V2-TTS ماډل تعقیبوي چې په مارچ کې معرفي شوی و، کوم چې په ټون، احساساتو او د خبرو کولو سټایل باندې تفصيلي کنټرول تمرکز کوي.
د Xiaomi MiMo-V2.5-TTS لاین اپ کې درې جلا ماډلونه شامل دي او د Xiaomi د MiMo خلاص پلیټ فارم له لارې په هیڅ لګښت پرته د محدود وخت لپاره شتون لري.
د بیس MiMo-V2.5-TTS ماډل کې مخکینی غږونه شامل دي او د وینا نرخ، سر، او احساساتو لپاره د سمونونو ملاتړ کوي.
MiMo-V2.5-TTS-VoiceDesign کاروونکو ته اجازه ورکوي چې د لنډ ان پټ جملې په کارولو سره په بشپړ ډول نوي غږ ټیمبرونه رامینځته کړي.
MiMo-V2.5-TTS-VoiceClone ډیزاین شوی ترڅو د لږ شمیر نمونو په کارولو سره یو ځانګړی غږ بیا تولید کړي پداسې حال کې چې د مختلف خبرو کولو سټایلونو او لارښوونو کې دوام لري.
Xiaomi وویل چې ماډلونه کولی شي د جوړښت شوي پیرامیټونو اړتیا پرځای د طبیعي ژبې لارښوونې تشریح کړي.
کاروونکي کولی شي تشریح کړي چې څنګه غږ باید په ساده ژبه کې غږ شي، د غږ اداکار لارښود ته ورته. سیسټم د کارولو قضیو لکه د لوبې کرکټرونو او آډیو ډرامو لپاره د پرت شوي سکریپټ سټایل ان پټونو ملاتړ هم کوي ، د کرکټر ځانګړتیاو ، صحنو او ډیالوګ جلا کنټرول ته اجازه ورکوي.
د انلاین آډیو ټاګونه هم ملاتړ کیږي ، کاروونکو ته اجازه ورکوي چې احساسات یا تحویل په یوه جمله کې په ځانګړي ټکو کې تنظیم کړي. دا ټګونه په ورته متن کې مخلوط کیدی شي او ویل کیږي چې په چینایي او انګلیسي دواړو کې کار کوي.
Xiaomi د خلاصې سرچینې وینا پیژندنې ماډل په توګه MiMo-V2.5-ASR هم خپروي.
شرکت وویل چې دا د ریښتینې نړۍ سناریوګانو لپاره ډیزاین شوی لکه دوه ژبني خبرو اترو، سیمه ایزو ژبو، او شور چاپیریال.
ملاتړ شوي چینايي ژبو کې وو، کانټونیز، مننان او سیچوانیز شامل دي. ماډل کولی شي د چینایي او انګلیسي ترمینځ د مخکینۍ ژبې ټاګونو پرته بدل شي. دا کولی شي د سندرې سندرې هم وپیژني حتی کله چې غږونه د میوزیک سره مخلوط وي.
د غونډو او څو سپیکر چاپیریالونو لپاره، سیسټم د سپیکر جلا کولو سره د متقابل خبرو اترو لیږد لپاره ډیزاین شوی.
Xiaomi وویل چې دا کولی شي د لوړ شور تنظیماتو او د لرې ساحې آډیو نیول سره دقت وساتي.
MiMo-V2.5-ASR کې جوړ شوي فونیټیکس او د شرایطو پراساس ټکي هم شامل دي، د پوسټ پروسس کولو اړتیا کموي.
Xiaomi وویل چې ماډل د بنچمارکونو په اړه د عصري یا نږدې عصري پایلې وړاندې کوي چې دوه ژبني پیژندنه، د ژبو پروسس کولو، او د کوډ بدلولو دندې پوښي.
د TTS ماډلونه د Xiaomi پلیټ فارم له لارې شتون لري او په MiMo سټوډیو کې ازمول کیدی شي. د ASR ماډل د مستقیم کارونې یا دودیز کولو لپاره د خلاصې سرچینې وزن او کوډ سره شتون لري.
📢 د وروستي ټیک او ټیلیکام خبرونو، ویډیوګانو او تحلیلونو لپاره همدا اوس د پروپاکستاني واټساپ ګروپ سره یوځای شئ!
په ګوګل نیوز کې پروپاکستاني تعقیب کړئ او د خپلې خوښې مینځپانګې ګړندي سکرول کړئ!
ونډې





