جُمُعَہ کے روز، کلاڈ کوڈ کے تخلیق کار بورس چرنی نے میٹا کی @Scale کانفرنس میں حاضری دی اور حیرت انگیز طور پر سامعین کا پہلا سوال لوپس کے بارے میں تھا۔

"کیا لوپس اگلی ہائپ سائیکل ہیں،" سائل نے پوچھا، "یا وہ حقیقی ہیں؟"

انہوں نے کہا کہ چرنی کا جواب ایک زور دار تھا "ہاں، وہ حقیقی ہیں۔"

"دو سال پہلے، ہم نے ہاتھ سے سورس کوڈ لکھا۔ ہم نے منتقلی شروع کی تاکہ ایجنٹ کوڈ لکھیں۔ اور اب ہم اس مقام پر منتقل ہو رہے ہیں جہاں ایجنٹ ایجنٹوں کو اشارہ کر رہے ہیں کہ پھر کوڈ لکھیں،" انہوں نے جاری رکھا۔ "ذریعہ کوڈ سے ایجنٹ تک کا مرحلہ جتنا بڑا تھا، لوپس بھی اتنا ہی اہم اور اتنا ہی بڑا قدم ہے۔"

بعد میں گفتگو میں (اوپر پوسٹ کی گئی یوٹیوب ویڈیو میں 32:00 کے قریب)، چرنی نے ان لوپس کے بارے میں مخصوص کیا جو وہ اپنے کام میں چلاتے رہتے ہیں۔ ایک ایجنٹ مسلسل کوڈ فن تعمیر کو بہتر بنانے کے طریقے تلاش کر رہا ہے، جبکہ دوسرا نقلی تجریدات تلاش کرتا ہے جو متحد ہو سکیں۔ وہ کسی دوسرے کوڈر کی طرح پل کی درخواستیں جمع کراتے ہیں، اور چونکہ کوڈ مسلسل تبدیل ہوتا رہتا ہے، اس لیے وہ چلنا کبھی نہیں روکتے۔

یہ ایک طاقتور خیال ہے، خاص طور پر ایک ایسی شخصیت کے ساتھ جو اس کے پیچھے چرنی جیسی اہم ہے۔ ایجنٹی AI کی طرف شفٹ ہونے کے ساتھ، زیادہ تر صارفین کی توجہ اپنے ایجنٹوں کو ممکنہ حد تک منظم کر رہی ہے: واضح اہداف قائم کریں، پیشرفت کی مجرد اکائیوں کو چیک کریں، اور انہیں پرامپٹ سے کہیں زیادہ بھٹکنے نہ دیں۔ لوپ ایجنٹوں کے ایک غول کو پس منظر میں مسلسل کام کرنے کی اجازت دے کر اسے ایک قدم آگے لے جاتا ہے۔ AI میں رکھنا بہت زیادہ بھروسہ ہے — لیکن ماڈلز کے تیزی سے بہتر ہونے کے ساتھ، یہ حقیقی کام کو سنبھالنے کے لیے AI حاصل کرنے کا اگلا قدم ہو سکتا ہے۔

پہچاننے والی پہلی چیز یہ ہے کہ یہ بالکل نیا نہیں ہے۔ ریکسریو لوپس — ایسے فنکشن جو کسی عمل کو دہرانے کے لیے خود کو کال کرتے ہیں، اس کے ساتھ ایسی شرط جو لوپ کو روکتی ہے — انٹرو کمپیوٹر سائنس کورسز کا ایک اہم مقام ہے۔ یہ لوپس ایک غیر متعین منطق کی پِیروی کر رہے ہیں — یعنی، یہ ایک ذیلی ایجنٹ ہے جو واضح حالت کے بجائے لوپ کو کب روکنا ہے اس کا انتخاب کرتا ہے — لیکن وہی بنیادی نقطہ نظر کام کر رہا ہے۔ جیسے ہی پروگرامرز نے کاموں کو مکمل کرنے کے لیے AI کا استعمال شروع کیا، AI کی نگرانی کرنے والے AI کے ساتھ recursive loop کا کچھ ورژن سامنے آنے کا پابند تھا۔

کلاسک کمپیوٹنگ کے برعکس، ایجنٹی لوپ دیوانہ وار سادہ ہو سکتے ہیں۔ سب سے زیادہ مقبول چالوں میں سے ایک رالف لوپ (Ralph Wiggum کے نام سے موسوم) ہے، جو بنیادی طور پر ان تمام کاموں کا خلاصہ کرتی ہے جو ماڈل نے کیے ہیں اور پوچھتے ہیں کہ کیا اس نے اپنا مقصد پورا کر لیا ہے۔ یہ AI ماڈلز کے کھو جانے سے نمٹنے کا ایک طریقہ ہے کیونکہ وہ بہت لمبے عرصے تک چلتے ہیں - بنیادی طور پر ماڈل کو آگے پیچھے کرنا جب تک کہ کام مکمل نہ ہو جائے۔

لوپس کے بارے میں سوچنے کا ایک اور طریقہ زیادہ ٹیسٹ ٹائم کمپیوٹ کے لیے عام دباؤ کا حصہ ہے۔ جیسا کہ اوپن اے آئی کے محقق نوم براؤن نے اس ماہ کے شروع میں مشاہدہ کیا تھا، اگر آپ ان پر کافی کمپیوٹ پھینکتے ہیں تو عصری ماڈل تقریباً کسی بھی مسئلے کو حل کر سکتے ہیں۔ اس کا مطلب یہ ہے کہ کسی مسئلے کے حل ہونے کو یقینی بنانے کا ایک طریقہ یہ ہے کہ جب تک یہ ختم نہ ہو جائے اس پر حساب لگاتے رہنا ہے۔ یہ خاص طور پر کوڈ بیس کو بہتر بنانے جیسے پہاڑی پر چڑھنے کے مسائل کے لیے درست ہے، جہاں ماڈل صرف اس وقت تک بڑھتی ہوئی اصلاحات کرتا رہ سکتا ہے جب تک کہ یہ ایک مقررہ حد تک نہ پہنچ جائے۔ یا، جیسا کہ Cherny کی مثال میں ہے، جب تک اس پر خرچ کرنے کا حساب ہوتا ہے، یہ صرف اس وقت تک اضافی اصلاحات کرتا رہ سکتا ہے۔

اگر یہ مہنگا لگتا ہے، تو یہ ہونا چاہئے. اس سے پہلے کے ایجنٹ AI کی طرح، AI لوپ ٹوکنز کے ذریعے سادہ سوال و جواب چیٹ بوٹس کے مقابلے میں بہت زیادہ تیزی سے جلتے ہیں — اور چونکہ بات یہ ہے کہ لوپ کو ہر وقت چلتا رہے، اس لیے اس کی کوئی حد نہیں ہے کہ آپ کتنا خرچ کر سکتے ہیں۔ یہ Anthropic کے لیے ٹھیک ہے، جو بالآخر ٹوکن فروخت کرنے والے کاروبار میں ہے، لیکن باقی سب کے لیے، یہ کام کرنے کا ایک مہنگا طریقہ ہو سکتا ہے۔

پھر بھی، ایجنٹ لوپ جس مسئلے کو حل کرنے کی کوشش کر رہا ہے اس پر منحصر ہے، اور صحیح سیٹ اپ جو ٹوکن کے اخراجات، بڑھے ہوئے اور دیگر کلاسک AI مسائل کی نگرانی کرنے کی اجازت دیتا ہے، فوائد اس قدر حیران کن ہو سکتے ہیں کہ لاگت سے زیادہ ہو جائیں۔