اینتھروپک پہلی بار اپنا سب سے طاقتور AI ماڈل عام لوگوں کے سامنے لا رہا ہے، لیکن وہ اسے گارڈریلز کے ساتھ کر رہا ہے۔
مَنگَل کو، AI فرم نے Claude Fable 5 لانچ کیا، جو اس کے Mythos ماڈل کا پہلا عوامی طور پر دستیاب ورژن ہے۔ Anthropic کا کہنا ہے کہ Fable 5 سافٹ ویئر انجینئرنگ، علمی کام، اور وژن میں مہارت رکھتا ہے، لیکن یہ سخت حفاظتی حدود کے ساتھ آتا ہے۔ سائبرسیکیوریٹی، بیالوجی، کیمسٹری، اور ڈسٹلیشن جیسے ہائی رسک والے علاقوں میں، ماڈل جوابات کو روکتا ہے اور Claude Opus 4.8 پر واپس آتا ہے۔
اپریل میں پیش نظارہ کے طور پر شروع کیا گیا، Mythos ابتدائی طور پر سائبر سیکیورٹی خدشات کی وجہ سے مٹھی بھر شراکت داروں تک محدود تھا۔ پچھلے ہفتے، انتھروپک نے 15 ممالک میں سیکڑوں تنظیموں تک رسائی کو بڑھایا، پھر سے ان تنظیموں پر توجہ مرکوز کی جو اہم بنیادی ڈھانچے کا انتظام کرتی ہیں۔
اب، اس ٹیکنالوجی کا ایک ورژن Anthropic's Claude API اور کھپت پر مبنی انٹرپرائز پلانز کے ذریعے کسی کے لیے بھی دستیاب ہے۔ سبسکرپشنز تک رسائی مراحل میں شروع ہوگی: 22 جون تک، Fable 5 کو بغیر کسی اضافی قیمت کے پرو، میکس، ٹیم، اور سیٹ پر مبنی انٹرپرائز پلانز میں شامل کیا جائے گا۔ 23 جون کو، Anthropic Fable 5 کو ان منصوبوں سے کھینچ لے گا، جس کے لیے استعمال کے کریڈٹس کی ضرورت ہے، اور اسے جلد از جلد ایک معیاری رکنیت کی خصوصیت کے طور پر بحال کرنے کے منصوبوں کے ساتھ۔
Anthropic Mythos کا ایک نیا ورژن بھی تعینات کر رہا ہے، جسے Mythos 5 کہا جاتا ہے، ان تنظیموں کے لیے جو پہلے ہی ایڈوانس ماڈل تک رسائی کی منظوری دے چکے ہیں۔
Fable کا آغاز اس وقت ہوا جب Anthropic OpenAI اور Elon Musk's SpaceX کے ساتھ عوامی بازاروں میں داخل ہونے کی تیاری کر رہی ہے۔ یہ AI فرم کی درخواست کی بھی پِیروی کرتا ہے جس میں بڑی عالمی AI لیبز پر زور دیا گیا ہے کہ وہ فرنٹیئر AI کی ترقی پر ایک مربوط بریک پیڈل قائم کریں۔ اینتھروپک نے خبردار کیا کہ سسٹمز اتنی تیزی سے ترقی کر رہے ہیں کہ وہ جلد ہی ریکرسیو سیلف امپروومنٹ (RSI) حاصل کر سکتے ہیں، خود مختار طور پر انسانی مداخلت کے بغیر خود کو بہتر بناتے ہیں۔
ایک Mythos کلاس ماڈل غلط ہاتھوں میں کیا کر سکتا ہے اس سے ہوشیار، Anthropic کا کہنا ہے کہ اس نے Fable 5 کو جاری کرنے سے پہلے جیل بریک کی کوششوں کے ساتھ اپنے درجہ بندی کرنے والوں کو دباؤ سے آزمایا۔
"اندرونی طور پر، ہم نے ایک بیرونی بگ باؤنٹی چلائی جس نے 1000 گھنٹے سے زیادہ کی جانچ میں کوئی یونیورسل جیل بریک نہیں بنایا۔ پھر ہم نے بیرونی ریڈ ٹیمنگ تنظیموں کے ساتھ کام کیا جو یونیورسل جیل بریکز تلاش کرنے میں بھی ناکام رہے۔"
اس نے کہا، وہاں اب بھی نئے حملے ہو سکتے ہیں۔ نتیجے کے طور پر، Fable 5 اور Mythos 5 کے آغاز کے ساتھ، Anthropic نے کہا کہ اسے تمام ٹریفک پر 30 دن کی برقراری کی ضرورت ہوگی، چاہے کاروباری اداروں کے پہلے صفر برقرار رکھنے کے معاہدے ہوں۔ اینتھروپک نے کہا کہ وہ ڈیٹا کو تربیت کے لیے استعمال نہیں کرے گا، صرف "پیچیدہ اور نئے حملوں کے خلاف دفاع کے لیے، بشمول نئے جیل بریک،" اور "جھوٹے مثبت کی شناخت اور اسے کم کرنے کے لیے۔" یہ پالیسی ایک ایسی صنعت کی مثال قائم کر سکتی ہے جس میں حفاظتی اقدام کے طور پر تیار کردہ ڈیٹا کو برقرار رکھنے کی لازمی پالیسیوں کے ساتھ تیزی سے طاقتور ماڈلز تک رسائی حاصل ہو گی۔
ان لوگوں کے لیے جو ماڈل کو استعمال کرتے رہتے ہیں، ہر سوال کو Fable 5 کا جواب نہیں ملے گا۔ اینتھروپک کا کہنا ہے کہ ایسے معاملات جن میں Fable کو Opus 4.8 کو موخر کرنا پڑتا ہے وہ نایاب ہیں، ابتدائی اعداد و شمار کے ساتھ کم از کم 95% Fable سیشن مکمل طور پر ماڈل کے اپنے ردعمل پر چل رہے ہیں۔
تھرڈ پارٹی ٹیسٹنگ میں، اینالیٹکس کمپنی ہیکس نے ایک بیان میں کہا کہ Fable وہ پہلا تھا جس نے پیچیدہ، طویل عرصے سے چلنے والے تجزیاتی کاموں کے اپنے بنیادی تجزیاتی بینچ مارک پر 90% حاصل کیا۔
ہیکس نے کہا، "سب سے مشکل سوالات پر، یہ مضبوط فیصلے اور توجہ کی طرف توجہ دیتا ہے۔"
وائب کوڈنگ پلیٹ فارم Base44 نے ایک بیان میں نوٹ کیا کہ Fable "ون شاٹنگ فل ایپس" میں بہتر ہے اور اس میں بہترین ٹول کالنگ ہے۔ AI سے چلنے والے ورک اسپیس اور ایجنٹ پلیٹ فارم Genspark نے کہا کہ Fable نے اپنی تشخیص میں ہر دوسرے ماڈل کو مات دی، اور UI ڈیزائن اور گیم کوڈنگ جیسے کاموں پر نمایاں طور پر بہتر کارکردگی کا مظاہرہ کیا۔
Fable 5 اور Mythos 5 دونوں کی قیمت $10 فی ملین ان پٹ ٹوکنز اور $50 فی ملین آؤٹ پٹ ٹوکنز ہے، Opus 4.8 کی قیمت دوگنی ہے۔ یہ قیمت اکیلے وسیع پیمانے پر استعمال کے لیے رکاوٹ کا کام کر سکتی ہے۔
بہت سے کاروباری ادارے اپنے سالانہ AI بجٹ کو جلد آتے دیکھ کر یا اڑتے دیکھ کر AI کے اخراجات پر تنقید کر رہے ہیں۔ Opus 4.8 جیسے جدید ماڈلز ان مسائل کو بڑھا سکتے ہیں، جدید استدلال کی مہارت کے ساتھ جو ایک درخواست کو متعدد کاموں میں تقسیم کر سکتے ہیں۔
اینتھروپک نے کہا کہ اسے Fable 5 کی مانگ بہت زیادہ اور پیشین گوئی کرنا مشکل ہونے کی توقع ہے۔ اور درحقیقت کچھ، جیسے شاپنگ ریوارڈ پلیٹ فارم Rakuten، سوچ سکتے ہیں کہ الٹا قیمت پوائنٹ کے قابل ہے۔
Rakuten نے ایک بیان میں کہا، "سب سے زیادہ کوشش پر، Fable اپنے کام کی عکاسی کرتا ہے اور اس کی تصدیق کرتا ہے۔" "ہمارے لیے، یہی وہ چیز ہے جو انتہائی خود مختار کارروائیوں کو ممکن بناتی ہے - اضافی سوچ خود ہی ادا کرتی ہے۔"