UK AI سيڪيورٽي انسٽيٽيوٽ پاران هڪ جائزو مليو ته OpenAI جي GPT-5.5 سائبر سيڪيورٽي ڪارڪردگي جي ساڳئي سطح تي پهچي ويو، ۽ ڪڏهن ڪڏهن انٿروپڪ جي Mythos Preview ماڊل کان به اڳتي هو.

Anthropic اڳي ئي محدود رسائي هئي Mythos Preview تائين، بلند ٿيل سائبر سيڪيورٽي خطرن جو حوالو ڏيندي ۽ رليز کي محدود ڪرڻ واري صنعت جي نازڪ ڀائيوارن تائين.

2023 کان وٺي، UK AI سيڪيورٽي انسٽيٽيوٽ 95 Capture the Flag چيلينجز ذريعي معروف AI ماڊلز کي آزمايو آهي، جنهن ۾ ريورس انجنيئرنگ، ويب استحصال، ڪرپٽ گرافي، ۽ لاڳاپيل سائبر سيڪيورٽي جا ڪم شامل آهن.

اعليٰ سطحي ماهرن جي ڪمن تي، GPT-5.5 71.4٪ جي سراسري پاس شرح حاصل ڪئي. Mythos Preview 68.6٪ رڪارڊ ڪيو، نتيجي ۾ انسٽيٽيوٽ چيو ته غلطي جي مارجن جي اندر هو.

هڪ مشڪل چيلنج ۾ جنهن ۾ ڊاسسبلر ٺاهڻ شامل آهي هڪ رسٽ بائنري کي ڊيڪوڊ ڪرڻ لاءِ، انسٽيٽيوٽ چيو ته GPT-5.5 اهو ڪم 10 منٽن ۽ 22 سيڪنڊن ۾ انساني مدد کانسواءِ حل ڪيو.

ڄاڻايل API قيمت ان رن لاءِ $1.73 هئي.

GPT-5.5 پڻ ملائي Mythos Preview in انسٽيٽيوٽ جي The Last Ones ٽيسٽ رينج، جيڪو هڪ ڪارپوريٽ نيٽ ورڪ تي 32-قدم ڊيٽا ڪڍڻ واري حملي کي نقل ڪري ٿو.

GPT-5.5 10 مان ٽن ڪوششن ۾ ڪامياب ٿيو، جڏهن ته Mythos Preview 10 مان ٻن ۾ ڪامياب ٿيو.

انسٽيٽيوٽ چيو ته اڳئين ماڊل هڪ ڀيرو به ٽيسٽ مڪمل نه ڪئي هئي.

GPT-5.5 کولنگ ٽاور سميوليشن مڪمل نه ڪيو، هڪ ٽيسٽ جنهن ۾ پاور پلانٽ ڪنٽرول سافٽ ويئر جي خرابي جي ڪوشش شامل آهي.

انسٽيٽيوٽ چيو ته هر اڳ آزمائشي AI ماڊل پڻ ناڪام ٿي چڪو آهي اهو منظر.

UK AI سيڪيورٽي انسٽيٽيوٽ چيو ته نتيجن مان معلوم ٿئي ٿو ته Mythos Preview شايد ماڊل مخصوص پيش رفت جي نمائندگي نٿو ڪري.

ان جي بدران، اهو چيو ته ڪارڪردگي ممڪن آهي ته ترقي يافته AI سسٽم ۾ وسيع بهتري کي ظاهر ڪري ٿي ڊگهي-افق خودمختياري، استدلال، ۽ ڪوڊنگ ۾.

📢 جديد ٽيڪنالاجي ۽ ٽيلي ڪام جي خبرن، وڊيوز ۽ تجزين لاءِ هاڻي ئي شامل ٿيو پروپاڪستاني جي WhatsApp گروپ!

گوگل نيوز تي پروپاڪستاني کي فالو ڪريو ۽ تيزيءَ سان پنهنجي پسنديده مواد ذريعي اسڪرول ڪريو!

شيئرز