د انګلستان د AI امنیت انسټیټیوټ لخوا ارزونه وموندله چې د OpenAI GPT-5.5 د سایبر امنیت فعالیت ورته کچې ته رسیدلی، او ځینې وختونه حتی د انتھروپیک د Mythos Preview ماډل څخه مخکې و.

انتروپیک دمخه د مایتوس مخکتنې ته محدود لاسرسی درلود ، د لوړ سایبر امنیت خطرونو په ګوته کول او د صنعت مهم شریکانو ته خوشې کول محدودول.

د 2023 راهیسې، د انګلستان د AI امنیت انسټیټیوټ د 95 له لارې د AI مخکښ ماډلونه ازمویل شوي د پرچم ننګونو سره چې ریورس انجینري، ویب استخراج، کریپټوګرافي، او اړوند سایبر امنیت دندې پوښي.

د لوړې کچې متخصص کارونو کې، GPT-5.5 د 71.4٪ اوسط پاس نرخ ترلاسه کړ. د Mythos Preview 68.6٪ ثبت شوی، په پایله کې انسټیټیوټ وویل چې د غلطۍ په حد کې و.

په یوه سخته ننګونه کې چې د زنګ بائنری ډیکوډ کولو لپاره د تحلیل کونکي رامینځته کول پکې شامل دي ، انسټیټیوټ وویل GPT-5.5 د بشري مرستې پرته په 10 دقیقو او 22 ثانیو کې دا کار حل کړ.

د دې چلولو لپاره راپور شوي API لګښت $1.73 و.

GPT-5.5 د انسټیټیوټ د وروستي Ones ټیسټ رینج کې د Mythos Preview سره هم سمون لري، کوم چې په یوه کارپوریټ شبکه کې د 32 مرحلو ډیټا استخراج برید انډول کوي.

GPT-5.5 له 10 څخه په دریو کې بریالی شو، پداسې حال کې چې Mythos Preview له 10 څخه په دوو کې بریالی شو.

انسټیټیوټ وویل چې هیڅ پخوانی ماډل حتی یو ځل هم ازموینه نه وه بشپړه کړې.

GPT-5.5 د کولنګ ټاور سمولیشن بشپړ نه کړ، یوه ازموینه چې د بریښنا پلانټ کنټرول سافټویر د ګډوډولو هڅه پکې شامله ده.

انسټیټیوټ وویل چې هر پخوانی ازمول شوی AI ماډل هم دا سناریو ناکامه شوې.

د انګلستان AI امنیت انسټیټیوټ وویل چې پایلې ښیې چې د Mythos Preview ممکن د ماډل ځانګړي پرمختګ استازیتوب ونه کړي.

پرځای یې، دا وویل چې فعالیت احتمال لري د اوږد افق خپلواکي، استدلال، او کوډ کولو کې د پرمختللي AI سیسټمونو پراخ پرمختګونه منعکس کړي.

📢 د وروستي ټیک او ټیلیکام خبرونو، ویډیوګانو او تحلیلونو لپاره همدا اوس د پروپاکستاني واټساپ ګروپ سره یوځای شئ!

په ګوګل نیوز کې پروپاکستاني تعقیب کړئ او د خپلې خوښې مینځپانګې ګړندي سکرول کړئ!

ونډې