AI ایجنٹس زیادہ نفیس ہوتے جا رہے ہیں۔ وہ سوالوں کے جواب دینے سے لے کر خود مختار طور پر کثیر مرحلہ پیچیدہ کاموں کو انجام دینے تک تیار ہو رہے ہیں۔

لیکن اس سے پہلے کہ ان ایجنٹوں پر صارفین کی جانب سے ٹرپ بک کرنے یا مالیاتی تجزیہ کرنے کے لیے بھروسہ کیا جائے، ماڈل فراہم کرنے والے اور ایسے ایجنٹس بنانے والے اسٹارٹ اپ اس بات کو یقینی بنانا چاہتے ہیں کہ وہ بہت سارے منظرناموں میں قابل اعتماد کارکردگی کا مظاہرہ کریں۔

AI لیبز اکثر اپنے ماڈل کی صلاحیت کو ظاہر کرنے کے لیے بینچ مارکس کا استعمال کرتی ہیں، لیکن ایک اعلی اسکور، یہاں تک کہ ایجنٹ پر مبنی بینچ مارک پر بھی، حقیقت میں یہ ثابت نہیں کرتا کہ ایک AI مختلف پیچیدہ، حقیقی دنیا کے کاموں کو صحیح طریقے سے انجام دے سکتا ہے۔

Patronus AI، ایک سٹارٹ اپ جو 2023 میں سابق Meta AI محققین آنند کنپپن اور Rebecca Qian کے ذریعے قائم کیا گیا تھا، ماڈل بنانے والوں اور کمپنیوں کو ماڈلز کو ٹھیک کرنے میں مدد کر رہا ہے تاکہ وہ مصنوعی ڈیجیٹل ماحول بنا کر جس میں ایجنٹوں کی کارکردگی کا جائزہ لیا جا سکے۔

سان فرانسسکو میں قائم سٹارٹ اپ کو ایک اہم مسئلہ حل کرنا چاہیے۔ قابل ذکر کیپیٹل کے ایک مینیجنگ ڈائریکٹر گلین سولومن کے مطابق، عملی طور پر ہر فرنٹیئر AI لیب اور بہت سے ابھرتے ہوئے اسٹارٹ اپ اب گاہک ہیں، جو کمپنی کے مصنوعی ماحول کی مانگ کو تقریباً ناقابل تسخیر قرار دیتے ہیں۔

پیٹرونس کی آمدنی میں گزشتہ سال کے دوران 15 گنا اضافہ ہوا ہے، جس سے سرمایہ کاروں کی اہم دلچسپی بڑھ رہی ہے۔ جُمِرات کو، کمپنی نے گرین فیلڈ پارٹنرز کی قیادت میں $50 ملین سیریز بی راؤنڈ کا اعلان کیا، جس میں قابل ذکر کیپٹل، لائٹ اسپیڈ، ڈیٹا ڈوگ اور سام سنگ کی شرکت شامل ہے۔ راؤنڈ کمپنی کی کل فنڈنگ ​​$70 ملین تک لے آتا ہے۔

Patronus ویب سائٹس اور اندرونی نظام کی نقلیں بنانے کے لیے اسے استعمال کرتا ہے جسے وہ "ڈیجیٹل ورلڈ ماڈلز" کہتے ہیں۔ ان ماحول میں، ایجنٹوں کو تربیت کے بعد تناؤ سے آزمایا جاتا ہے جس میں کمک سیکھنے کا استعمال کیا جاتا ہے، جو بار بار کامیاب کام کی تکمیل کا بدلہ دیتا ہے اور غلطیوں کو سزا دیتا ہے۔

AI لیبز کو ان ڈیجیٹل سمولیشنز میں بہت اہمیت ملتی ہے کیونکہ وہ ایجنٹوں کو مختلف، کبھی کبھی غیر متوقع، منظرناموں کو آزمانے کا موقع دیتے ہیں۔ کمپنی اپنے نقطہ نظر کا موازنہ کرتی ہے کہ کس طرح Waymo نے خود مختار کاروں کو مصنوعی دنیا بنا کر نایاب خطرات کے خلاف گاڑیوں کی جانچ کرنے کے لیے تربیت دی، جیسے شدید موسم یا گیند کے پیچھے بھاگنے والا بچہ۔

AI ایجنٹوں کے ساتھ فرق یہ ہے کہ وہ شارٹ کٹس لیتے ہیں، جس کا مطلب ہے کہ وہ کام کو صحیح طریقے سے مکمل کرنے میں ناکام رہتے ہیں۔ "Patronus ہیکس کو تلاش کرنے اور اس بات کو یقینی بنانے میں بہت اچھا ہے کہ وہ ماڈلز کو جوابدہ ٹھہرا رہے ہیں،" سلیمان نے کہا۔

پیٹرونس فی الحال سافٹ ویئر انجینئرنگ اور فنانس کے لیے اپنی مصنوعی ڈیجیٹل دنیا فراہم کر رہا ہے، لیکن کنپن کے مطابق، یہ صرف شروعات ہیں۔

انہوں نے کہا، "آج ہم ان مسائل پر بہت توجہ مرکوز کر رہے ہیں جو قابل تصدیق ہیں، اس لیے وہ مسائل جن کی آپ فوری طور پر جانچ اور تصدیق کر سکتے ہیں، لیکن ایک ٹن مزید ایسے علاقے ہیں جو بہت ناقابل تصدیق ہیں یا ان کی تصدیق کرنا بہت مشکل ہے۔"

صرف اس لیے کہ یہ عمل قابل تصدیق ہیں اس کا مطلب یہ نہیں ہے کہ وہ آسان ہیں۔ کنپپن نے کہا، "ہم حقیقت میں ایسا ماحول پیدا کرنے کے قابل ہونا چاہتے ہیں جس میں آپ ایک ایسا ایجنٹ چلا سکتے ہیں جو 10 گھنٹے یا 10 دن یا 10 ہفتوں تک چل سکے۔"

جہاں تک حریفوں کا تعلق ہے، پیٹرونس کا خیال ہے کہ یہ بنیادی طور پر ان اندرونی ٹیموں کے خلاف مقابلہ کر رہی ہے جو AI لیبز نے پہلے ہی ایجنٹ کے رویے کا اندازہ لگانے کے لیے بنائی ہیں۔ جب کہ مرکر اور سرج جیسی انسانی ڈیٹا فرمیں ماڈل بنانے والوں کو کمک سیکھنے میں مدد کرتی ہیں، پیٹرونس اس بات کا جائزہ لے کر مختلف طریقے سے کام کرتا ہے کہ ایجنٹ کسی انسانی شمولیت کے بغیر کیسے برتاؤ کرتے ہیں۔