لفظ "دوبارہ" AI حلقوں میں تازہ ترین buzzword ہے۔ دو الگ الگ سٹارٹ اپس نے نام لیا ہے، اور بہت سے لوگوں نے اپنے روڈ میپ میں Recursive self-improvement (RSI) کا حوالہ دینا شروع کر دیا ہے۔ اس سے پہلے کے AGI کی طرح، RSI ایک تباہ کن AI ٹیک آف کے لیے تین حروف والا لفظ بن گیا ہے - یہاں تک کہ اگر اس کے معنی کے بارے میں تھوڑا سا اختلاف بھی ہے۔

بنیادی اصطلاحات میں، RSI سے مراد ایک AI سسٹم ہے جو خود کو مسلسل اپ گریڈ کر سکتا ہے۔ ایک بار جب AI سسٹم اپ گریڈ سائیکل کو انسانوں کے مقابلے میں بہتر طریقے سے منظم کر سکتے ہیں، تو یہ عمل ایک بند لوپ بن سکتا ہے، صرف کمپیوٹ طاقت تک محدود ہو سکتا ہے جس تک وہ رسائی حاصل کر سکتے ہیں، اور انسانوں کے لیے مزید ضروری یا مددگار بھی نہیں رہے گا۔

خوفناک یا نہیں، یہ ایک ایسا وژن ہے جس کا پیچھا کرنے کے لیے بہت ساری AI لیبز بے چین ہیں۔

اس مہینے کے شروع میں، معروف AI محقق، رچرڈ سوچر نے RSI کے ساتھ ایک واضح مقصد کے طور پر شروع کیا گیا مناسب نام Recursive Superintelligence شروع کیا۔ "ہماری بنیادی توجہ بڑے پیمانے پر صحیح معنوں میں دوبارہ پیدا کرنے والی، خود کو بہتر بنانے والی سپر انٹیلی جنس بنانا ہے،" Socher نے لانچ کے موقع پر TechCrunch کو بتایا، "جس کا مطلب ہے کہ تحقیقی آئیڈیاز کے تصور، نفاذ اور توثیق کا پورا عمل خودکار ہوگا۔"

بہت سے دوسرے ممتاز محققین پہلے ہی اسی مقصد کا تعاقب کر رہے ہیں، ایک ایسی پیش رفت کی امید کر رہے ہیں جو دوبارہ خود کو بہتر بنانے کو ممکن بنائے۔

سب سے نمایاں افراد میں سے ایک ایلکس کارپاتھی ہیں، جو ٹیسلا اور اوپن اے آئی کی ایک افسانوی شخصیت ہیں، جو LLMs کو ایک ایسے پروجیکٹ کے لیے آسان کاموں پر تربیت دینے کے لیے ایجنٹ سوارم کا استعمال کر رہے ہیں جسے وہ آٹو ریسرچ کہتے ہیں۔ کارپیتھی اس منصوبے کے بارے میں غیر معمولی طور پر کھلے ہوئے ہیں، سنگ میل کے بارے میں باقاعدگی سے ٹویٹ کرتے ہیں اور عوامی GitHub ریپو کے ذریعے عمارت کے بلاکس کو دستیاب کراتے ہیں۔ اب تک، کام زیادہ تر GPT-2 پیمانے کے ماڈل میں معمولی بہتری لانے تک ہی محدود رہا ہے – جیسا کہ کارپتھی نے مارچ میں نوٹ کیا، "یہ کوئی نئی نہیں، زمینی تحقیق ہے (ابھی تک)" – لیکن یہ بہت سے دوسرے محققین کو RSI کے خواب کی پِیروی کرنے پر راضی کرنے کے لیے کافی ہے۔ اور کارپتھی کے ساتھ اب انتھروپک میں پری ٹریننگ پر کام کر رہا ہے، اس کے پاس اس خیال کو بڑے پیمانے پر لاگو کرنے کے کافی مواقع ہوں گے۔

ایڈاپشن – جس کی بنیاد کوہرے اور گوگل کے عالم سارہ ہوکر نے رکھی تھی – نے حال ہی میں فرنٹیئر ٹریننگ کو خودکار بنانے کی کوشش میں آٹو سائنٹسٹ کے نام سے ایک ایسا ہی ٹول لانچ کیا۔ Karpathy کے آٹو ریسرچرز کی طرح، سسٹم ایجنٹوں کو بڑھتی ہوئی بہتری کے لیے تربیت دیتا ہے – لیکن Adaption کے لیے، مقصد یہ ہے کہ پورے پیمانے پر فرنٹیئر ماڈل کو تربیت دینا آسان ہو۔ اگر وہی محققین فرنٹیئر کو آگے بڑھانا شروع کر دیتے ہیں، تو سسٹم تیزی سے RSI جیسی کسی چیز میں گھل سکتا ہے۔

Disarray کی بانی Doris Xin نے اس وقت زیادہ مخصوص RSI کی دلچسپی مبذول کرائی جب اس کے خود تربیت یافتہ مشین لرننگ ایجنٹ نے حالیہ Kaggle مقابلے میں 28 تمغے حاصل کیے، بہت سے انسانی تربیت یافتہ ایجنٹوں کو شکست دی۔ جیسا کہ وہ اسے دیکھتی ہے، بڑا چیلنج قابل اعتماد ہے۔

"میں بحث کروں گا، لامحدود حساب اور لامحدود وقت کے افق کو دیکھتے ہوئے، ہم پہلے ہی وہاں موجود ہیں،" زن نے مجھے بتایا۔ "میں ایک دلیل پیش کرنا چاہتا ہوں کہ یہ واقعی کوئی تخلیقی کوشش نہیں ہے۔ یہ صرف گوشت اور آلو کی بہت سی انجینئرنگ ہے۔"

اس بات کے بھی کافی شواہد موجود ہیں کہ AI انڈسٹری کسی بھی معنی خیز طریقے سے تکراری نظاموں کے بہت قریب نہیں ہے - اور اب بھی اپنی پیشرفت کے بارے میں ہوشیار عوام سے بات کرنے میں مصروف ہے۔ لہذا گوگل کے سی ای او سندر پچائی نے بنیادی طور پر ایک حالیہ پوڈ کاسٹ انٹرویو میں اعتراف کیا۔

"یہ ایک تسلسل ہے، اور ہم سب یقینی طور پر ترقی کر رہے ہیں،" پچائی نے کہا۔ "لیکن جس طرح سے لوگ R.S.I. کی وضاحت کرتے ہیں، یہ ایکسلریشن کی اگلی سطح کی نمائندگی کرے گا اور اس کے بہت سے مضمرات ہوں گے، لیکن ہم ابھی تک وہاں نہیں ہیں۔"

لیکن تسلسل میں خود کو بہتر بنانے والے AI سسٹمز کی ایک بہت بڑی تعداد شامل ہے۔ جنوری میں، Claude Code کے لیے Anthropic کے لیڈ پروگرامرز میں سے ایک نے اندازہ لگایا کہ اس کی ٹیم کے کوڈ کا "تقریباً 100%" ٹول کے ذریعے لکھا گیا تھا - ایک صاف اعتراف کہ Claude Code لفظی طور پر خود لکھ رہا تھا۔

صرف اس وجہ سے کہ انجینئرز ایک AI ٹول استعمال کر رہے ہیں اس کا مطلب یہ نہیں ہے کہ ٹول ان کی جگہ لے سکتا ہے – لیکن ایسا لگتا ہے کہ Anthropic بھی انجینئرز کی جگہ لینے کے قریب پہنچ رہا ہے۔ Mythos preview سے منسلک ایک حالیہ سروے میں، 18 میں سے پانچ اینتھروپک انجینئرز کا خیال تھا کہ، استعمال میں بہتری کے ساتھ، Mythos کا یہ ورژن جلد ہی ایک L4 انجینئر کا متبادل ہو سکتا ہے - ایک درمیانے درجے کا پروگرامر جو بغیر نگرانی کے ملوث پروجیکٹس پر کام کر سکتا ہے۔

پھر بھی، کچھ ایسی ہی کمزوریاں تھیں جن کی آپ توقع کر سکتے ہیں۔

"L4 کے مقابلے کلاڈ کی کچھ بڑی رپورٹ شدہ کمزوریوں میں شامل ہیں: ہَفتَہ بھر کے مبہم کاموں کا خود انتظام، تنظیم کی ترجیحات کو سمجھنا، ذائقہ، تصدیق، ہدایات کی پِیروی کرنا، اور علمیات،" رپورٹ پڑھتی ہے۔ دوسرے لفظوں میں، اس کی کمزوریاں خود سمت کے ساتھ شامل ہر چیز ہیں، جو RSI کے لیے بنیاد ہے۔ لیکن یقینی طور پر، ہر چیز کے لیے، کلاڈ صحیح قدم اٹھانے کے لیے تیار ہے۔

بالکل اسی طرح جیسے اس سے پہلے AGI کی اصطلاح تھی، AI انڈسٹری بھی ہمیں یہ نہیں بتا سکتی کہ یہ ایک بامعنی تکراری نظام کی نمائش سے کتنی دور ہے۔ جب جارج ٹاؤن کے سینٹر فار سیکیورٹی اینڈ ایمرجنگ ٹکنالوجی نے گزشتہ سال RSI کا مطالعہ کرنے کے لیے ماہرین کے ایک گروپ کو اکٹھا کیا، تو اس گروپ کو جائزوں میں ایک بڑی تقسیم نظر آئی - کچھ کو ایک آسنن "سپر انٹیلیجنس" طرز کے دھماکے کی توقع تھی جب کہ دوسروں کو سست پیشرفت اور حتمی سطح مرتفع کی توقع تھی۔ لیکن سب نے اتفاق کیا کہ تکرار نے مستقبل کی پیشین گوئی کرنا خاص طور پر مشکل بنا دیا۔

ہیلن ٹونر، CSET کی ڈائریکٹر اور OpenAI میں بورڈ کی ایک سابق رکن نے TechCrunch کو بتایا کہ AI تحقیق کرنے کے لیے صرف AI ٹولز کا استعمال RSI کے طور پر اہل ہونے کے لیے کافی نہیں ہے۔ "وہ صرف اتنا ہی AI استعمال کر رہے ہیں جتنا وہ کر سکتے ہیں،" ٹونر نے ٹیک کرنچ کو بتایا۔ "اور مجھے لگتا ہے کہ یہ RSI کی کلاسک تعریف سے مختلف ہے، جو واقعی یہ ہے کہ انسانوں کی ضرورت نہیں ہے۔"

ٹونر نے METR کی Ayeja Cotra کی ایک حالیہ پوسٹ کی طرف اشارہ کیا، جو AI ریسرچ ٹیک اوور کے راستے پر مختلف سنگ میلوں کو ممتاز کرتا ہے۔ ایک قدم، جسے کوٹرا "کافییت" کہتا ہے، تب آئے گا جب تمام انسانوں کو ہٹانے کے بعد بھی نظام تحقیق کر سکتا ہے - چاہے نتیجے میں ہونے والی تحقیق اتنی قیمتی یا موثر نہ ہو۔ "برابری" تب آتی ہے جب صرف AI نظام تحقیق میں اتنا ہی اچھا ہوتا ہے جتنا کہ صرف انسانوں کے لیے۔ "بالادستی"، آخری مرحلہ اس وقت آتا ہے جب ایک AI-صرف نظام انسانوں اور AI کے درمیان باہمی تعاون کے نظام سے بہتر کارکردگی کا مظاہرہ کرتا ہے۔

بالآخر، کوٹرا نے یہ نتیجہ اخذ کیا کہ AI اپنے طور پر کچھ کام کرنے کے قابل ہونے کی کافی حد کے بہت قریب ہے - کارپیتھی کے آٹو ریسرچ سسٹم کی طرف سے کی گئی اضافی تبدیلیوں کی طرح۔ کوٹرا لکھتے ہیں "اگر آپ نے مجھے بتایا کہ یہ سنگ میل پہلے ہی گزر چکا ہے تو مجھے پوری طرح سے صدمہ نہیں ہوگا، اور مجھے امید ہے کہ یہ اگلے دو سالوں میں ہو جائے گا۔"

وہ اس بارے میں کم واضح ہے کہ برابری کب آئے گی، لیکن ایک بار ایسا ہونے کے بعد، وہ سوچتی ہیں کہ یہ "اے آئی کی ترقی کی رفتار کو بڑے پیمانے پر تیز کرے گا، جس کے نتیجے میں ایک اور سال کے اندر AI تحقیق کی بالادستی ہو جائے گی۔"

اسکیلنگ قوانین پر بنائے گئے بہت سارے AI کے ساتھ، یہ سوچنے کا ایک مضبوط رجحان ہے کہ RSI اسی وکر کی پِیروی کرے گا۔ ٹونر کا خیال ہے کہ RSI کے ذریعے AI ریسرچ اور ڈیولپمنٹ کی پِیروی کرنے والوں میں سے بہت سے لوگ "اسے ایک خوبصورت ہموار سیڑھی کے طور پر سوچتے ہیں، جہاں آپ صرف اسکیل کرتے رہ سکتے ہیں۔"

لیکن یہاں تک کہ اگر اے آئی کے محققین کارپتھی کے آٹو ریسرچرز کی طرح بڑھتی ہوئی بہتری لانے میں کامیاب ہو جاتے ہیں، تو تحقیق کے پورے عمل کو ختم کرنے میں بڑے چیلنجز ہوں گے۔ ٹونر اسے کمپیوٹنگ کی تاریخ کے لحاظ سے رکھتا ہے، جس میں دیکھا جاتا ہے کہ انسان اوپر سے چیزوں کو ہدایت کرتے ہوئے زیادہ سے زیادہ عمل کو آگے بڑھاتے ہیں۔

"ہم مشینی زبانوں سے اسمبلی کی زبان اور مرتب شدہ زبانوں میں چلے گئے؛ آپ کمپیوٹر کی ہمت سے آگے بڑھ رہے ہیں،" ٹونر کہتے ہیں۔ "لیکن انسان اب بھی، کسی بدیہی معنوں میں، شو چلا رہا ہے۔"

اس تمثیل سے آگے بڑھنا انجینئرنگ اور صف بندی دونوں میں اہم چیلنجز کا سامنا کرے گا۔ لیکن بڑے پیمانے پر ہونے والی سرمایہ کاری کے باوجود، کوئی لامحدود حساب دستیاب نہیں ہے – اور انسانی محنت اور مشینی ذہانت کے درمیان بنیادی تجارت پر قابو پانا مشکل ہوگا۔

جہاں تک apocalyptic وژن کے کل تکراری AI نظام کا تعلق ہے؟ صرف ایک چیز جس پر محققین بنیادی طور پر متفق ہیں وہ یہ ہے کہ، AGI کی طرح، یہ ابھی تک یہاں نہیں ہے۔