ایک حالیہ تجربے میں، Anthropic نے ایک درجہ بند بازار بنایا جہاں AI ایجنٹس خریداروں اور فروخت کنندگان دونوں کی نمائندگی کرتے تھے، حقیقی سامان اور حقیقی رقم کے لیے حقیقی سودے کرتے تھے۔

کمپنی نے اس ٹیسٹ کو تسلیم کیا - جسے اس نے پروجیکٹ ڈیل کہا - صرف 69 اینتھروپک ملازمین کا "خود منتخب کردہ شریک پول کے ساتھ ایک پائلٹ تجربہ" تھا جنہیں اپنے ساتھی کارکنوں سے سامان خریدنے کے لیے $100 (گفٹ کارڈز کے ذریعے ادائیگی) کا بجٹ دیا گیا تھا۔

بہر حال، اینتھروپک نے کہا کہ اسے "پروجیکٹ ڈیل نے کتنی اچھی طرح سے کام کیا" سے متاثر کیا، جس میں 186 سودے ہوئے، جن کی کل قیمت $4000 سے زیادہ تھی۔

کمپنی نے کہا کہ اس نے اصل میں مختلف ماڈلز کے ساتھ چار الگ الگ بازار چلائے — ایک وہ جو "حقیقی" تھا (جہاں ہر کسی کی نمائندگی کمپنی کے جدید ترین ماڈل کے ذریعے کی گئی تھی، اور تجربے کے بعد اصل میں سودوں کے ساتھ) اور مزید تین مطالعہ کے لیے۔

بظاہر، جب صارفین کی نمائندگی زیادہ جدید ماڈلز کے ذریعے کی جاتی ہے، تو وہ "معروضی طور پر بہتر نتائج حاصل کرتے ہیں،" Anthropic نے کہا۔ لیکن ایسا لگتا ہے کہ صارفین اس تفاوت کو محسوس نہیں کرتے ہیں، جس سے "ایجنٹ کے معیار کے فرق" کے امکان میں اضافہ ہوتا ہے جہاں "کھوتے ہوئے لوگوں کو یہ احساس نہیں ہوتا کہ وہ بدتر ہیں۔"

اس کے علاوہ، ایجنٹوں کو دی گئی ابتدائی ہدایات فروخت کے امکانات یا بات چیت کی گئی قیمتوں پر اثر انداز نہیں ہوئیں۔