جيئن ته شپنگ ايجنٽ جون صلاحيتون بنيادن جي ماڊل ڪمپنين جي وچ ۾ ٽيبل اسٽيڪ بڻجي وينديون آهن، انٿروپڪ ڪلواڊ سونيٽ 5 جاري ڪري رهيو آهي، ليب جي ماڊل ماڊل جو هڪ وڌيڪ طاقتور ۽ ايجنٽ نسخو.

”اهو منصوبا ٺاهي سگھي ٿو، اوزار استعمال ڪري سگھي ٿو جهڙوڪ برائوزر ۽ ٽرمينلز، ۽ خودمختاري طور تي ان سطح تي هلائي سگھي ٿو، جيڪو ڪجھ مهينا اڳ، وڏن ۽ وڌيڪ قيمتي ماڊل جي ضرورت هئي،“ Anthropic هڪ بلاگ پوسٽ ۾ چيو.

اهو فريمنگ آئيني آهي ته OpenAI ۽ گوگل پنهنجي تازي رليز بابت ڇا چيو آهي. OpenAI جي GPT-5.6 Sol گذريل هفتي جي ڏيک ۾ شروع ڪئي وئي، ۽ اهو پڻ فرم جو سڀ کان وڌيڪ ايجنٽ ماڊل آهي، صارفين کي وڌيڪ خودمختيار ڪمن لاء سبجيڪٽ ۾ ڪم کي ورهائڻ جي اجازت ڏئي ٿو. گوگل جو Gemini 3.5 فليش، جيڪو مئي ۾ شروع ڪيو ويو، هڪ گفتگو واري چيٽ بوٽ کان هڪ ايجنٽ ٽول ڏانهن شفٽ ڪيو ويو جيڪو منصوبابندي، ٺاهي، ۽ حقيقي ڪم تي گهٽ ۾ گهٽ انساني ان پٽ سان ٻيهر ڪري ٿو.

سونيٽ 5 جي پچ تصديق ڪئي وئي آهي ته ايجنٽ جي صلاحيت هر قيمت تي نئين بيس لائين توقع آهي. ھاڻي فرق ڪرڻ وارو اھو نه آھي ته ڪير ايجنٽي ڪم بھترين ڪري سگھي ٿو، پر اھو ڪيترو سستو ڪري سگھي ٿو ۽ ڪيئن قابل اعتماد طريقي سان انساني نگراني کان سواءِ.

سونيٽ 5 ڪارڪردگي جو واعدو ڪري ٿو Opus 4.8 جي ويجهو، پر تمام گھٽ قيمتن لاءِ. اڱارو کان وٺي، ڪلاڊ سونيٽ 5 مفت ۽ پرو منصوبن لاءِ ڊفالٽ ماڊل هوندو ۽ هر رڪنيت لاءِ دستياب آهي.

لانچ تي، سونيٽ 5 جي قيمت $2 في ملين انپٽ ٽوڪن ۽ $10 في ملين آئوٽ پٽ ٽوڪن تي 31 آگسٽ تائين آهي، جنهن کان پوءِ قيمت وڌي ويندي $3 في ملين ان پٽ ٽوڪن ۽ $10 في ملين آئوٽ ٽوڪن تي. اهو سونيٽ 5 کي Opus 4.8 کان سستو بڻائي ٿو، انهي سان گڏ OpenAI جي GPT-5.5 ۽ گوگل جي Gemini 3.1 پرو. (اهو اڃا به وڌيڪ قيمتي آهي Gemini 3.5 Flash.)

انتھروپڪ جي مطابق، نئون ماڊل پنھنجي اڳوڻي سونيٽ 4.6 تي، فيبروري ۾ جاري ڪيل، ايجنٽ جي ڪارڪردگي جھڙوڪ دليل، اوزار جي استعمال، سافٽ ويئر ڪوڊنگ، ۽ علم جي ڪم تي، خاص سڌارن جو مظاهرو ڪري ٿو.

مثال طور، هڪ معيار تي، سونيٽ 5 اسڪور ڪيو 63.2٪ ايجنٽ ڪوڊنگ تي، مقابلي ۾ Opus 4.8 جي 69.2٪ ۽ سونيٽ 4.6 جو 58.1٪. علم جي ڪم جي معيار تي، سونيٽ 5 اصل ۾ Opus 4.8 کان ٿورو اڳتي وڌي ٿو، جيڪو تمام مشڪل مسئلن کي حل ڪرڻ تي فتح حاصل ڪرڻ لاءِ سڃاتو وڃي ٿو جهڙوڪ ذيلي فيصلو ڪالون ۽ گہرا تحقيق.

”اوپس 4.8 اڃا تائين انهن ڪمن تي اعليٰ درستگيءَ لاءِ چونڊ جو نمونو آهي، پر سونيٽ 5 ڊولپرز کي گهٽ قيمتن جا اختيار فراهم ڪري ٿو جيڪي اڳي موجود شين جي ڀيٽ ۾ تمام اعليٰ معيار جا آهن،“ Anthropic چوي ٿو. "Sonnet 5 ۽ Opus 4.8 جي وچ ۾، صارفين قيمت ۽ ڪارڪردگي جو صحيح توازن ڳولڻ لاء ڪوشش جي سطح کي ترتيب ڏئي سگھن ٿا."

بلاگ پوسٽ ۾ بيان ڪيل ٽيسٽرن جي مطابق، سونيٽ 5 پيچيده ڪمن کي ختم ڪرڻ ۾ پڻ شاندار آهي جتي پوئين ماڊل ورزن کي مختصر طور تي روڪيو وڃي ها ۽ "پنهنجي پنهنجي پيداوار کي واضح طور تي پڇيو وڃي."

"اسان Claude Sonnet 5 کي ٻن حصن واري نوڪري ڏني - Salesforce اڪائونٽ ٽائرز کي اپڊيٽ ڪيو، هڪ لانچ جو اعلان انٽرپرائز رابطن ڏانهن موڪليو - ۽ اهو آخر تائين ختم ٿي ويو،" ڊينيل شيپارڊ، زيپيئر ۾ هڪ سينئر انجنيئر، هڪ بيان ۾ چيو. "جيڪو اڌ رستي تي اسٽال ڪندو هو. روزانو آٽوميشن لاءِ، اهو هڪ بي عقل آهي."

حفاظت تي، سونيٽ 5 پڻ "ناپسنديده رويي" جي گهٽ شرح ڏيکاري ٿو جهڙوڪ غلط استعمال ۽ ٺڳيءَ سان تعاون ان جي اڳڪٿي جي ڀيٽ ۾، ان کي ايجنٽ جي حوالي سان استعمال ڪرڻ کي وڌيڪ محفوظ بڻائي ٿو. اهو بهتر آهي ته بدسلوڪي درخواستن کي رد ڪرڻ ۽ فوري انجيڪشن حملن ۾ اغوا جي ڪوششن کي رد ڪرڻ. اهو پڻ hallucinates ۽ sycophantic رويي ۾ مشغول آهي Sonet 4.6 کان گهٽ شرح تي.

اهو چيو ته، اهو ساڳيو سطح تي نه آهي Opus 4.8 ۽ Claude Mythos Preview جڏهن اهو غلط طريقي سان اچي ٿو. "تشخيص پڻ ڏيکاري ٿو ته اهو اسان جي موجوده Opus ماڊلز جي ڀيٽ ۾ خطرناڪ سائبر سيڪيورٽي ڪمن کي انجام ڏيڻ جي تمام گهٽ صلاحيت آهي،" بلاگ پوسٽ پڙهي ٿو.

پياري جي گڏيل باني Fabian Hedin هڪ بيان ۾ چيو ته Claude Sonnet 5 "غير محفوظ درخواستن کي صاف ۽ مسلسل رد ڪري ٿو."

"Lovable تي، اسان لکين بلڊرز جي هٿن ۾ طاقتور اوزار وجهي رهيا آهيون،" هيڊين چيو. "هڪ ماڊل جيڪو ڄاڻي ٿو ته ڪڏهن نه چئجي صرف ايترو ئي اهم آهي جيترو هڪ جيڪو ڄاڻي ٿو ته ڪيئن ٺاهيو."