OpenAI خميس چيو آهي ته ان جي API ۾ هاڻي شامل ڪيو ويندو ڪيترن ئي نئين آواز انٽيليجنس فيچرز ڊولپرز کي ايپس ٺاهڻ ۾ مدد ڏيڻ لاءِ جيڪي ڳالهائي سگهن ٿيون ، ٽرانسڪرپشن ڪري سگهن ٿيون ۽ استعمال ڪندڙن سان گفتگو جو ترجمو ڪري سگهن ٿيون.

ڪمپني جو نئون GPT‑Realtime‑2 ٻيو آواز جو ماڊل آهي، جيڪو هڪ حقيقي آواز جي تخليق ٺاهڻ لاءِ ٺاهيو ويو آهي جيڪو استعمال ڪندڙن سان ڳالهه ٻولهه ڪري سگهي ٿو. بهرحال، ان جي اڳڪٿي جي برعڪس (GPT-Realtime-1.5) هي هڪ GPT-5-ڪلاس دليل سان ٺهيل آهي جنهن کي OpenAI چوي ٿو ته صارفين کان وڌيڪ پيچيده درخواستن سان معاملو ڪرڻ لاء ٺاهي وئي.

ڪمپني پڻ شروع ڪري رهي آهي GPT‑Realtime‑Translate جيڪو، جيئن ته اهو آواز آهي، ٺاهيو ويو آهي حقيقي وقت ۾ ترجمي جون خدمتون مهيا ڪرڻ لاءِ جيڪي استعمال ڪندڙ سان ”رفتار“ ڪن، گفتگو سان. فيچر ۾ 70 کان وڌيڪ انپٽ ٻوليون شامل آھن (يعني اھي ٻوليون جيڪي سمجھي سگھن ٿيون) ۽ 13 ٻاھريون ٻوليون (جيڪي ٻوليون اھو ڳالهائيندڙ ڏانھن رلي ٿو).

آخرڪار، ڪمپني هڪ نئين ٽرانسپشن جي صلاحيت پڻ شروع ڪئي آهي، GPT-Realtime-Whisper، جيڪا صارفين کي لائيو اسپيچ-ٽو-ٽيڪسٽ صلاحيتون ڏئي ٿي جيڪا ڳالهه ٻولهه ٿيندي آهي.

"گڏيل، ماڊل جيڪي اسان لانچ ڪري رهيا آهيون حقيقي وقت آڊيو کي سادي ڪال ۽ جواب کان آواز جي انٽرفيس ڏانهن منتقل ڪن ٿا جيڪي اصل ۾ ڪم ڪري سگهن ٿا: ٻڌو، دليل، ترجمو، ٽرانسڪرپشن، ۽ عمل ڪريو جيئن گفتگو ظاهر ٿئي ٿي،" ڪمپني چيو.

اهي تازه ڪاريون ڪنهن لاءِ سٺيون هونديون؟ ڪمپنيون جيڪي ڪسٽمر سروس جي صلاحيتن کي وڌائڻ چاهيندا آهن هڪ واضح هدف آهن. جڏهن ته، OpenAI اهو پڻ نوٽ ڪري ٿو ته ان جي نئين خاصيتن جي مدد سان مختلف شعبن جي مدد ڪندي، بشمول تعليم، ميڊيا، واقعا، ۽ خالق پليٽ فارم، ٻين جي وچ ۾.

جيئن ته ڪارائتو اهي اوزار هڪ ڪاروباري نقطه نظر کان نظر اچن ٿا، اهو پڻ لڳي ٿو ته اهي غلط استعمال ٿي سگهن ٿيون. ڪمپني جو چوڻ آهي ته اها اسپام، فريب، يا آن لائن بدسلوڪي جي ٻين شڪلن کي ٺاهڻ لاءِ پنهنجي نئين خاصيتن کي غلط استعمال ٿيڻ کان روڪڻ لاءِ گارڊ ريلز ٺاهي وئي آهي. ڪجهه محرڪ سسٽم ۾ شامل ڪيا ويا آهن ته جيئن "ڳالهيون روڪي سگهجن ٿيون جيڪڏهن اهي معلوم ڪيا وڃن ته اهي اسان جي نقصانڪار مواد جي هدايتن جي ڀڃڪڙي ڪندي،" OpenAI چيو.

سڀ نوان آواز جا ماڊل OpenAI جي Realtime API ۾ شامل آهن. ترجمي ۽ ويسپر کي منٽ جي حساب سان بل ڪيو ويندو آهي، جڏهن ته GPT-Realtime-2 ٽوڪن جي استعمال سان بل ڪيو ويندو آهي.