مصنوعی ذہانت دنیا کو تبدیل کر رہی ہے، اور اس کے ساتھ ہی یہ بیان کرنے کے لیے ایک بالکل نئی زبان ایجاد کر رہی ہے کہ یہ کیسے کر رہی ہے۔ AI کے بارے میں پڑھنے میں پانچ منٹ گزاریں اور آپ LLMs، RAG، RLHF، اور درجن بھر دیگر اصطلاحات میں حصہ لیں گے جو ٹیک کی دنیا میں انتہائی ذہین لوگوں کو بھی غیر محفوظ محسوس کر سکتے ہیں۔ یہ لغت اس کو ٹھیک کرنے کی ہماری کوشش ہے۔ جیسے جیسے فیلڈ تیار ہوتا ہے ہم اسے باقاعدگی سے اپ ڈیٹ کرتے ہیں، اس لیے اسے ایک زندہ دستاویز سمجھیں، بالکل اسی طرح جیسے AI سسٹمز یہ بیان کرتا ہے۔ مصنوعی جنرل انٹیلی جنس، یا AGI، ایک غیر معمولی اصطلاح ہے. لیکن یہ عام طور پر AI سے مراد ہے جو بہت سے کاموں میں، اگر زیادہ تر نہیں، تو اوسط انسان سے زیادہ قابل ہے۔ OpenAI کے سی ای او سیم آلٹمین نے ایک بار AGI کو "ایک درمیانی انسان کے مساوی کے طور پر بیان کیا جسے آپ ایک ساتھی کارکن کے طور پر رکھ سکتے ہیں۔" دریں اثنا، OpenAI کا چارٹر AGI کو "انتہائی خودمختار نظاموں کے طور پر بیان کرتا ہے جو معاشی طور پر انتہائی قیمتی کام میں انسانوں کو پیچھے چھوڑ دیتے ہیں۔" گوگل ڈیپ مائنڈ کی سمجھ ان دو تعریفوں سے قدرے مختلف ہے۔ لیب AGI کو "AI کے طور پر دیکھتی ہے جو زیادہ تر علمی کاموں میں کم از کم انسانوں کی طرح قابل ہے۔" الجھن میں؟ پریشان ہونے کی کوئی بات نہیں - اسی طرح ماہرین AI تحقیق میں سب سے آگے ہیں۔

مصنوعی جنرل انٹیلی جنس، یا AGI، ایک غیر معمولی اصطلاح ہے. لیکن یہ عام طور پر AI سے مراد ہے جو بہت سے کاموں میں، اگر زیادہ تر نہیں، تو اوسط انسان سے زیادہ قابل ہے۔ OpenAI کے سی ای او سیم آلٹمین نے ایک بار AGI کو "ایک درمیانی انسان کے مساوی کے طور پر بیان کیا جسے آپ ایک ساتھی کارکن کے طور پر رکھ سکتے ہیں۔" دریں اثنا، OpenAI کا چارٹر AGI کو "انتہائی خودمختار نظاموں کے طور پر بیان کرتا ہے جو معاشی طور پر انتہائی قیمتی کام میں انسانوں کو پیچھے چھوڑ دیتے ہیں۔" گوگل ڈیپ مائنڈ کی سمجھ ان دو تعریفوں سے قدرے مختلف ہے۔ لیب AGI کو "AI کے طور پر دیکھتی ہے جو زیادہ تر علمی کاموں میں کم از کم انسانوں کی طرح قابل ہے۔" الجھن میں؟ پریشان ہونے کی کوئی بات نہیں - اسی طرح ماہرین AI تحقیق میں سب سے آگے ہیں۔

AI ایجنٹ سے مراد ایک ایسا ٹول ہے جو آپ کی طرف سے کاموں کی ایک سیریز کو انجام دینے کے لیے AI ٹیکنالوجیز کا استعمال کرتا ہے — اس سے آگے جو کہ زیادہ بنیادی AI چیٹ بوٹ کر سکتا ہے — جیسے کہ اخراجات جمع کروانا، ٹکٹ بک کرنا یا کسی ریستوراں میں میز، یا یہاں تک کہ کوڈ لکھنا اور برقرار رکھنا۔ تاہم، جیسا کہ ہم پہلے بیان کر چکے ہیں، اس ابھرتی ہوئی جگہ میں بہت سارے متحرک ٹکڑے ہیں، لہذا "AI ایجنٹ" کا مطلب مختلف لوگوں کے لیے مختلف چیزیں ہو سکتی ہیں۔ انفراسٹرکچر بھی اب بھی تیار کیا جا رہا ہے تاکہ اس کی تصور کردہ صلاحیتوں کو پورا کیا جا سکے۔ لیکن بنیادی تصور کا مطلب ایک خود مختار نظام ہے جو ملٹی اسٹپ کاموں کو انجام دینے کے لیے ایک سے زیادہ AI سسٹمز کو کھینچ سکتا ہے۔

API کے اختتامی نکات کو سافٹ ویئر کے ایک ٹکڑے کی پشت پر "بٹن" کے طور پر سوچیں جسے دوسرے پروگرام اسے کام کرنے کے لیے دبا سکتے ہیں۔ ڈویلپرز ان انٹرفیسز کو انضمام کی تعمیر کے لیے استعمال کرتے ہیں — مثال کے طور پر، ایک ایپلیکیشن کو دوسرے سے ڈیٹا کھینچنے کی اجازت دینا، یا کسی AI ایجنٹ کو اس قابل بنانا کہ وہ ہر انٹرفیس کو دستی طور پر کام کیے بغیر براہ راست تھرڈ پارٹی سروسز کو کنٹرول کر سکے۔ زیادہ تر سمارٹ ہوم ڈیوائسز اور منسلک پلیٹ فارمز میں یہ چھپے ہوئے بٹن دستیاب ہوتے ہیں، یہاں تک کہ اگر عام صارفین انہیں کبھی نہ دیکھیں یا ان کے ساتھ بات چیت نہ کریں۔ جیسے جیسے AI ایجنٹس زیادہ قابل ہو جاتے ہیں، وہ تیزی سے اپنے طور پر ان اختتامی نقطوں کو تلاش کرنے اور استعمال کرنے کے قابل ہو جاتے ہیں، جس سے آٹومیشن کے لیے طاقتور — اور بعض اوقات غیر متوقع — امکانات کھل جاتے ہیں۔

ایک سادہ سے سوال کو دیکھتے ہوئے، ایک انسانی دماغ اس کے بارے میں زیادہ سوچے بغیر بھی جواب دے سکتا ہے - جیسے "کون سا جانور لمبا ہے، زرافہ یا بلی؟" لیکن بہت سے معاملات میں، آپ کو صحیح جواب دینے کے لیے اکثر قلم اور کاغذ کی ضرورت ہوتی ہے کیونکہ درمیانی اقدامات ہوتے ہیں۔ مثال کے طور پر، اگر ایک کسان کے پاس مرغیاں اور گائے ہیں، اور ان کے ساتھ 40 سر اور 120 ٹانگیں ہیں، تو آپ کو جواب (20 مرغیاں اور 20 گائے) کے ساتھ آنے کے لیے ایک سادہ مساوات لکھنی پڑ سکتی ہے۔

AI سیاق و سباق میں، بڑے لینگویج ماڈلز کے لیے چین آف تھیٹ استدلال کا مطلب ہے کہ کسی مسئلے کو چھوٹے، درمیانے درجے کے اقدامات میں توڑ کر حتمی نتیجہ کے معیار کو بہتر بنایا جائے۔ عام طور پر جواب حاصل کرنے میں زیادہ وقت لگتا ہے، لیکن جواب کے درست ہونے کا امکان زیادہ ہوتا ہے، خاص طور پر منطق یا کوڈنگ کے تناظر میں۔ استدلال کے ماڈلز روایتی بڑے زبان کے ماڈلز سے تیار کیے گئے ہیں اور تقویت بخش سیکھنے کی بدولت چین کی سوچ کے لیے بہتر بنائے گئے ہیں۔

(دیکھیں: بڑی زبان کا ماڈل)

یہ ایک زیادہ مخصوص تصور ہے کہ ایک "AI ایجنٹ"، جس کا مطلب ہے ایک ایسا پروگرام جو ایک مقصد کو پورا کرنے کے لیے قدم بہ قدم قدم اٹھا سکتا ہے۔ ایک کوڈنگ ایجنٹ سافٹ ویئر کی ترقی پر لاگو ایک خصوصی ورژن ہے۔ کسی انسان کو جائزہ لینے اور چسپاں کرنے کے لیے محض کوڈ تجویز کرنے کے بجائے، ایک کوڈنگ ایجنٹ خود مختاری سے کوڈ لکھ سکتا ہے، جانچ سکتا ہے اور ڈیبگ کر سکتا ہے، اس طرح کے تکراری، آزمائشی اور غلطی کے کام کو سنبھال سکتا ہے جو عام طور پر ایک ڈویلپر کا دن کھاتا ہے۔ یہ ایجنٹ کم سے کم انسانی نگرانی کے ساتھ پورے کوڈ بیس میں کام کر سکتے ہیں، کیڑے تلاش کر سکتے ہیں، ٹیسٹ چلا سکتے ہیں، اور اصلاحات کو آگے بڑھا سکتے ہیں۔ اس کے بارے میں سوچیں جیسے ایک بہت تیز انٹرن کی خدمات حاصل کریں جو کبھی نہیں سوتا ہے اور کبھی توجہ نہیں کھوتا ہے - حالانکہ، کسی بھی انٹرن کی طرح، ایک انسان کو ابھی بھی کام کا جائزہ لینے کی ضرورت ہے۔ اگرچہ کسی حد تک ملٹی ویلنٹ اصطلاح ہے، کمپیوٹ سے عام طور پر اہم کمپیوٹیشنل پاور مراد ہوتی ہے جو AI ماڈلز کو کام کرنے کی اجازت دیتی ہے۔ اس قسم کی پروسیسنگ AI صنعت کو ایندھن دیتی ہے، جس سے اسے اپنے طاقتور ماڈلز کو تربیت دینے اور تعینات کرنے کی صلاحیت ملتی ہے۔ یہ اصطلاح اکثر ان قسم کے ہارڈ ویئر کے لیے ایک شارٹ ہینڈ ہوتی ہے جو کمپیوٹیشنل پاور فراہم کرتی ہے — GPUs، CPUs، TPUs، اور انفراسٹرکچر کی دوسری شکلیں جو کہ جدید AI انڈسٹری کی بنیاد ہیں۔

خود کو بہتر بنانے والی مشین لرننگ کا ایک ذیلی سیٹ جس میں AI الگورتھم کو ملٹی لیئرڈ، مصنوعی نیورل نیٹ ورک (ANN) ڈھانچے کے ساتھ ڈیزائن کیا گیا ہے۔ یہ انہیں آسان مشین لرننگ پر مبنی سسٹمز، جیسے لکیری ماڈلز یا فیصلہ سازی کے درختوں کے مقابلے میں زیادہ پیچیدہ ارتباط بنانے کی اجازت دیتا ہے۔ گہرے سیکھنے کے الگورتھم کی ساخت انسانی دماغ میں نیوران کے باہم جڑے ہوئے راستوں سے تحریک حاصل کرتی ہے۔

گہری سیکھنے والے AI ماڈلز خود ڈیٹا میں اہم خصوصیات کی شناخت کرنے کے قابل ہیں، بجائے اس کے کہ انسانی انجینئرز کو ان خصوصیات کی وضاحت کرنے کی ضرورت ہو۔ ڈھانچہ الگورتھم کو بھی سپورٹ کرتا ہے جو غلطیوں سے سیکھ سکتے ہیں اور دہرانے اور ایڈجسٹمنٹ کے عمل کے ذریعے اپنی پیداوار کو بہتر بنا سکتے ہیں۔ تاہم، گہرے سیکھنے کے نظام کو اچھے نتائج (لاکھوں یا اس سے زیادہ) حاصل کرنے کے لیے بہت سارے ڈیٹا پوائنٹس کی ضرورت ہوتی ہے۔ وہ عام طور پر آسان مشین لرننگ الگورتھم کے مقابلے ٹریننگ میں زیادہ وقت لیتے ہیں — اس لیے ترقیاتی اخراجات زیادہ ہوتے ہیں۔

(دیکھیں: نیورل نیٹ ورک)

ڈفیوژن بہت سے آرٹ-، میوزک-، اور ٹیکسٹ تیار کرنے والے AI ماڈلز کے مرکز میں ٹیک ہے۔ طبیعیات سے متاثر ہو کر، بازی کے نظام آہستہ آہستہ ڈیٹا کی ساخت کو "تباہ" کر دیتے ہیں — مثال کے طور پر، تصاویر، گانے، وغیرہ — شور ڈال کر جب تک کہ کچھ باقی نہ رہے۔ طبیعیات میں، بازی بے ساختہ اور ناقابل واپسی ہے - کافی میں پھیلی ہوئی چینی کو کیوب کی شکل میں بحال نہیں کیا جا سکتا۔ لیکن AI میں پھیلاؤ کے نظام کا مقصد تباہ شدہ ڈیٹا کو بحال کرنے کے لیے ایک طرح کا "ریورس ڈفیوژن" عمل سیکھنا ہے، جس سے ڈیٹا کو شور سے بازیافت کرنے کی صلاحیت حاصل ہوتی ہے۔

ڈسٹلیشن ایک تکنیک ہے جس کا استعمال ایک بڑے AI ماڈل سے 'استاد-طالب علم' ماڈل کے ساتھ علم نکالنے کے لیے کیا جاتا ہے۔ ڈویلپرز ٹیچر ماڈل کو درخواستیں بھیجتے ہیں اور آؤٹ پٹس کو ریکارڈ کرتے ہیں۔ جوابات کا موازنہ بعض اوقات ڈیٹا سیٹ سے کیا جاتا ہے تاکہ یہ دیکھا جا سکے کہ وہ کتنے درست ہیں۔ یہ نتائج پھر طالب علم کے ماڈل کو تربیت دینے کے لیے استعمال کیے جاتے ہیں، جو استاد کے رویے کا اندازہ لگانے کے لیے تربیت دی جاتی ہے۔

ڈسٹلیشن کو کم سے کم ڈسٹلیشن نقصان کے ساتھ بڑے ماڈل کی بنیاد پر ایک چھوٹا، زیادہ موثر ماڈل بنانے کے لیے استعمال کیا جا سکتا ہے۔ غالباً اسی طرح OpenAI نے GPT-4 ٹربو تیار کیا، جو GPT-4 کا تیز تر ورژن ہے۔

اگرچہ تمام AI کمپنیاں اندرونی طور پر ڈسٹلیشن کا استعمال کرتی ہیں، ہو سکتا ہے کہ اسے کچھ AI کمپنیوں نے فرنٹیئر ماڈلز کو پکڑنے کے لیے بھی استعمال کیا ہو۔ کسی مدمقابل سے کشید کرنا عام طور پر AI API اور چیٹ معاونین کی سروس کی شرائط کی خلاف ورزی کرتا ہے۔

اس سے مراد کسی AI ماڈل کی مزید تربیت ہے تاکہ کسی خاص کام یا علاقے کے لیے کارکردگی کو بہتر بنایا جا سکے جو کہ پہلے اس کی تربیت کا ایک مرکزی نقطہ تھا — عام طور پر نئے، خصوصی (یعنی ٹاسک پر مبنی) ڈیٹا کو فیڈ کرکے۔

بہت سے AI سٹارٹ اپ ایک تجارتی پروڈکٹ بنانے کے لیے بڑے لینگویج ماڈلز کو ایک نقطہ آغاز کے طور پر لے رہے ہیں لیکن اپنے ڈومین کے مخصوص علم اور مہارت کی بنیاد پر فائن ٹیوننگ کے ساتھ پہلے کے تربیتی چکروں کی تکمیل کے ذریعے ٹارگٹ سیکٹر یا کام کے لیے افادیت کو بڑھانے کے لیے کوشاں ہیں۔

(دیکھیں: بڑی زبان کا ماڈل [LLM])

ایک GAN، یا جنریٹو ایڈورسریئل نیٹ ورک، مشین لرننگ فریم ورک کی ایک قسم ہے جو کہ حقیقت پسندانہ ڈیٹا تیار کرنے کی بات کرنے پر جنریٹو AI میں کچھ اہم پیشرفت کی نشاندہی کرتا ہے — بشمول (لیکن نہ صرف) ڈیپ فیک ٹولز۔ GANs میں اعصابی نیٹ ورکس کے ایک جوڑے کا استعمال شامل ہوتا ہے، جن میں سے ایک اپنے تربیتی ڈیٹا کو ایک آؤٹ پٹ تیار کرنے کے لیے کھینچتا ہے جسے جانچنے کے لیے دوسرے ماڈل کو منتقل کیا جاتا ہے۔

دونوں ماڈلز بنیادی طور پر ایک دوسرے سے آگے نکلنے کی کوشش کرنے کے لیے پروگرام کیے گئے ہیں۔ جنریٹر اپنے آؤٹ پٹ کو امتیازی سلوک سے گزرنے کی کوشش کر رہا ہے، جبکہ امتیاز کرنے والا مصنوعی طور پر تیار کردہ ڈیٹا کو تلاش کرنے کے لیے کام کر رہا ہے۔ یہ منظم مقابلہ اضافی انسانی مداخلت کی ضرورت کے بغیر AI آؤٹ پٹ کو زیادہ حقیقت پسندانہ بنا سکتا ہے۔ اگرچہ GANs عام مقصد کے AI کے بجائے تنگ ایپلی کیشنز (جیسے حقیقت پسندانہ تصاویر یا ویڈیوز تیار کرنا) کے لیے بہترین کام کرتے ہیں۔

Halucination AI انڈسٹری کی ترجیحی اصطلاح ہے AI ماڈلز کے لیے چیزیں بنانے کے لیے - لفظی طور پر معلومات پیدا کرنا جو غلط ہے۔ ظاہر ہے، یہ AI معیار کے لیے ایک بہت بڑا مسئلہ ہے۔ ہیلوسینیشنز GenAI کے نتائج پیدا کرتے ہیں جو گمراہ کن ہوسکتے ہیں اور یہاں تک کہ حقیقی زندگی کے خطرات کا باعث بھی بن سکتے ہیں - ممکنہ طور پر خطرناک نتائج کے ساتھ (ایک صحت کے سوال کے بارے میں سوچیں جو نقصان دہ طبی مشورہ دیتا ہے)۔

AIs کی معلومات کو گھڑنے کا مسئلہ تربیتی ڈیٹا میں خلاء کے نتیجے میں پیدا ہوتا ہے۔ ہیلوسینیشنز تیزی سے خصوصی اور/یا عمودی AI ماڈلز کی طرف بڑھنے میں حصہ ڈال رہے ہیں - یعنی ڈومین کے لیے مخصوص AIs جن کے لیے کم مہارت کی ضرورت ہوتی ہے - ایک طریقہ کے طور پر علم کے خلا کے امکانات کو کم کرنے اور غلط معلومات کے خطرات کو کم کرنے کے لیے۔

انفرنس ایک AI ماڈل کو چلانے کا عمل ہے۔ یہ پیشین گوئیاں کرنے یا پہلے دیکھے گئے ڈیٹا سے نتائج اخذ کرنے کے لیے ماڈل کو ڈھیلا کر رہا ہے۔ واضح رہے، تربیت کے بغیر اندازہ نہیں ہو سکتا۔ ایک ماڈل کو ڈیٹا کے سیٹ میں پیٹرن سیکھنا چاہیے اس سے پہلے کہ وہ اس تربیتی ڈیٹا سے مؤثر طریقے سے نکال سکے۔

بہت سے قسم کے ہارڈویئر اندازہ لگا سکتے ہیں، جس میں اسمارٹ فون پروسیسرز سے لے کر بیفی GPUs تک اپنی مرضی کے مطابق ڈیزائن کردہ AI ایکسلریٹر شامل ہیں۔ لیکن یہ سبھی ماڈلز کو یکساں طور پر نہیں چلا سکتے۔ بہت بڑے ماڈلز کو ایک لیپ ٹاپ بمقابلہ اعلی درجے کی AI چپس والے کلاؤڈ سرور پر پیشین گوئیاں کرنے میں عمر لگتی ہے۔

[دیکھیں: تربیت]

بڑے لینگوئج ماڈلز، یا LLMs، AI ماڈلز ہیں جو مشہور AI معاونین کے ذریعے استعمال کیے جاتے ہیں، جیسے ChatGPT، Claude، Google's Gemini، Meta's AI Llama، Microsoft Copilot، یا Mistral's Le Chat۔ جب آپ کسی AI اسسٹنٹ کے ساتھ چیٹ کرتے ہیں، تو آپ زبان کے ایک بڑے ماڈل کے ساتھ بات چیت کرتے ہیں جو آپ کی درخواست پر براہ راست یا مختلف دستیاب ٹولز، جیسے ویب براؤزنگ یا کوڈ انٹرپریٹرس کی مدد سے کارروائی کرتا ہے۔

LLMs اربوں عددی پِیرامیٹرز (یا وزن، نیچے ملاحظہ کریں) سے بنے گہرے اعصابی نیٹ ورکس ہیں جو الفاظ اور فقروں کے درمیان تعلق کو سیکھتے ہیں اور زبان کی نمائندگی کرتے ہیں، الفاظ کا ایک کثیر جہتی نقشہ۔

یہ ماڈل ان نمونوں کو انکوڈنگ سے بنائے گئے ہیں جو انہیں اربوں کتابوں، مضامین اور نقلوں میں ملتے ہیں۔ جب آپ LLM کا اشارہ کرتے ہیں، تو ماڈل سب سے زیادہ ممکنہ پیٹرن تیار کرتا ہے جو فوری طور پر فٹ بیٹھتا ہے۔

(دیکھیں: نیورل نیٹ ورک)

میموری کیش سے مراد ایک اہم عمل ہے جو اندازہ کو بڑھاتا ہے (یہ وہ عمل ہے جس کے ذریعے AI صارف کے سوال کا جواب پیدا کرنے کے لیے کام کرتا ہے)۔ جوہر میں، کیشنگ ایک اصلاح کی تکنیک ہے، جس کا اندازہ زیادہ موثر بنانے کے لیے بنایا گیا ہے۔ AI واضح طور پر ہائی آکٹین ریاضی کے حساب سے چلایا جاتا ہے اور جب بھی یہ حسابات کیے جاتے ہیں، وہ زیادہ طاقت استعمال کرتے ہیں۔ کیشنگ کو ایسے حسابات کی تعداد کو کم کرنے کے لیے ڈیزائن کیا گیا ہے جو کسی ماڈل کو مستقبل کے صارف کے سوالات اور آپریشنز کے لیے مخصوص حسابات کو محفوظ کر کے چلانے کی ضرورت پڑ سکتی ہے۔ میموری کیشنگ کی مختلف قسمیں ہیں، حالانکہ ان میں سے ایک زیادہ معروف KV (یا کلیدی قدر) کیچنگ ہے۔ KV کیشنگ ٹرانسفارمر پر مبنی ماڈلز میں کام کرتی ہے، اور کارکردگی کو بڑھاتی ہے، صارف کے سوالات کے جوابات پیدا کرنے میں لگنے والے وقت (اور الگورتھمک لیبر) کو کم کرکے تیز رفتار نتائج دیتی ہے۔

(دیکھیں: تخمینہ)

نیورل نیٹ ورک سے مراد کثیر پرتوں والی الگورتھمک ڈھانچہ ہے جو گہری سیکھنے کو تقویت دیتا ہے — اور زیادہ وسیع طور پر، بڑے لینگویج ماڈلز کے ظہور کے بعد جنریٹیو AI ٹولز میں پوری تیزی۔

اگرچہ ڈیٹا پروسیسنگ الگورتھم کے ڈیزائن ڈھانچے کے طور پر انسانی دماغ کے گھنے باہم جڑے ہوئے راستوں سے تحریک لینے کا خیال 1940 کی دہائی کا ہے، لیکن یہ گرافیکل پروسیسنگ ہارڈویئر (GPUs) کا حالیہ اضافہ تھا — ویڈیو گیم انڈسٹری کے ذریعے — جس نے واقعی اس نظریہ کی طاقت کو کھول دیا۔ یہ چپس پہلے دور کے مقابلے میں بہت زیادہ پرتوں کے ساتھ تربیتی الگورتھم کے لیے موزوں ثابت ہوئیں - اعصابی نیٹ ورک پر مبنی AI سسٹمز کو آواز کی شناخت، خود مختار نیویگیشن، اور منشیات کی دریافت سمیت بہت سے ڈومینز میں کہیں زیادہ بہتر کارکردگی حاصل کرنے کے قابل بنانا۔

(دیکھیں: بڑی زبان کا ماڈل [LLM])

اوپن سورس سے مراد سافٹ ویئر ہے — یا، تیزی سے، AI ماڈلز — جہاں بنیادی کوڈ کو عوامی طور پر ہر کسی کے لیے استعمال، معائنہ یا ترمیم کرنے کے لیے دستیاب کر دیا جاتا ہے۔ AI دنیا میں، Meta’s Llama ماڈلز کا خاندان ایک نمایاں مثال ہے۔ لینکس آپریٹنگ سسٹمز میں مشہور تاریخی متوازی ہے۔ اوپن سورس اپروچز دنیا بھر کے محققین، ڈویلپرز، اور کمپنیوں کو ایک دوسرے کے کام کو سرفہرست بنانے، پیشرفت کو تیز کرنے اور آزادانہ حفاظتی آڈٹ کو فعال کرنے کی اجازت دیتے ہیں جو بند نظام آسانی سے فراہم نہیں کر سکتے۔ بند ماخذ کا مطلب ہے کہ کوڈ نجی ہے — آپ پروڈکٹ کو استعمال کر سکتے ہیں لیکن یہ نہیں دیکھ سکتے کہ یہ کیسے کام کرتا ہے، جیسا کہ OpenAI کے GPT ماڈلز کا معاملہ ہے — ایک امتیاز جو AI صنعت میں واضح بحثوں میں سے ایک بن گیا ہے۔ متوازی ہونے کا مطلب ہے ایک کے بعد ایک کی بجائے ایک ہی وقت میں بہت سی چیزیں کرنا — جیسے 10 ملازمین کا ایک ہی وقت میں کسی پروجیکٹ کے مختلف حصوں پر کام کرنے کے بجائے ایک ملازم ہر کام کو ترتیب سے کرتا ہے۔ AI میں، ہم آہنگی تربیت اور تخمینہ دونوں کے لیے بنیادی ہے: جدید GPUs کو خاص طور پر متوازی طور پر ہزاروں حسابات کو انجام دینے کے لیے ڈیزائن کیا گیا ہے، یہی ایک بڑی وجہ ہے کہ وہ انڈسٹری کی ہارڈویئر ریڑھ کی ہڈی بن گئے۔ جیسے جیسے AI سسٹمز زیادہ پیچیدہ ہوتے جاتے ہیں اور ماڈلز بڑے ہوتے جاتے ہیں، بہت سی چپس اور بہت سی مشینوں میں کام کو متوازی کرنے کی صلاحیت اس بات کا تعین کرنے میں سب سے اہم عوامل میں سے ایک بن گئی ہے کہ ماڈلز کو کتنی جلدی اور لاگت سے مؤثر طریقے سے بنایا اور تعینات کیا جا سکتا ہے۔ بہتر متوازی حکمت عملیوں کی تحقیق اب اپنے طور پر مطالعہ کا ایک شعبہ ہے۔

RAMageddon ایک غیر تفریحی رجحان کے لیے ایک پرلطف نئی اصطلاح ہے جو ٹیک انڈسٹری کو تیز کر رہی ہے: بے ترتیب رسائی میموری کی مسلسل بڑھتی ہوئی کمی، یا RAM چپس، جو ہماری روزمرہ کی زندگی میں استعمال ہونے والی تمام ٹیک پروڈکٹس کو طاقت بخشتی ہے۔ جیسا کہ AI انڈسٹری کھل چکی ہے، سب سے بڑی ٹیک کمپنیاں اور AI لیبز - جو سب سے زیادہ طاقتور اور موثر AI حاصل کرنے کے خواہاں ہیں - اپنے ڈیٹا سینٹرز کو طاقت بخشنے کے لیے اتنی زیادہ RAM خرید رہی ہیں کہ ہم میں سے باقی لوگوں کے لیے بہت کچھ نہیں بچا ہے۔ اور اس سپلائی میں رکاوٹ کا مطلب ہے کہ جو بچا ہے وہ زیادہ سے زیادہ مہنگا ہوتا جا رہا ہے۔

اس میں گیمنگ جیسی صنعتیں شامل ہیں (جہاں بڑی کمپنیوں کو کنسولز پر قیمتیں بڑھانا پڑی ہیں کیونکہ ان کے آلات کے لیے میموری چپس تلاش کرنا مشکل ہے)، کنزیومر الیکٹرانکس (جہاں میموری کی کمی ایک دہائی سے زیادہ عرصے میں اسمارٹ فون کی ترسیل میں سب سے زیادہ کمی کا سبب بن سکتی ہے)، اور جنرل انٹرپرائز کمپیوٹنگ (کیونکہ وہ کمپنیاں اپنے ڈیٹا سینٹرز کے لیے کافی ریم حاصل نہیں کر سکتی ہیں)۔ خوفناک قلت ختم ہونے کے بعد ہی قیمتوں میں اضافے کے رکنے کی توقع کی جاتی ہے لیکن بدقسمتی سے، ایسا کوئی نشان نہیں ہے جو جلد ہی کسی بھی وقت ہونے والا ہے۔

AGI کی طرح، بار بار خود کو بہتر بنانا ایک حد ہے کہ کس طرح سمارٹ AI حاصل کر سکتا ہے، اور یہ انسانوں پر کتنا کم انحصار کر سکتا ہے۔ RSI منظر نامے میں، AI ماڈلز انسانی مداخلت کے بغیر خود کو بہتر بنانا شروع کر دیتے ہیں، جس سے صلاحیتوں اور خودمختاری میں بہت زیادہ تیزی آتی ہے۔ کچھ بیانات میں، یہ یکسانیت کے مترادف ایک تباہ کن لمحہ ہوگا، ایک ایسا لمحہ جب AI ماڈل بیرونی مداخلت سے محفوظ ہوجاتے ہیں۔ لیکن RSI ایک بنیادی صلاحیت کو بھی بیان کرتا ہے - کیا ایک AI ماڈل اپنا جانشین ڈیزائن کر سکتا ہے؟ - جس سے انجینئرز کے لیے اسے بنانے کی کوشش کرنا بہت آسان ہو جاتا ہے۔ متعدد حالیہ AI سٹارٹ اپس نے بار بار خود کو بہتر بنانے والے ماڈلز بنانے کا ارادہ کیا ہے، لیکن ان میں سے زیادہ تر تحقیق کے لیے RSI کو صرف اگلی سرحد کے طور پر پیش کرتے ہوئے، apocalyptic اثرات کو مسترد کرتے ہیں۔

کمک سیکھنا AI کی تربیت کا ایک طریقہ ہے جہاں ایک نظام چیزوں کو آزما کر اور صحیح جوابات کے لیے انعامات حاصل کر کے سیکھتا ہے — جیسے اپنے پیارے پالتو جانور کو علاج کے ساتھ تربیت دینا، سوائے اس منظر نامے میں "پالتو جانور" ایک نیورل نیٹ ورک ہے اور "ٹریٹ" ایک ریاضیاتی سگنل ہے جو کامیابی کی نشاندہی کرتا ہے۔ زیر نگرانی سیکھنے کے برعکس، جہاں ایک ماڈل کو لیبل شدہ مثالوں کے ایک مقررہ ڈیٹاسیٹ پر تربیت دی جاتی ہے، کمک سیکھنے سے ماڈل کو اس کے ماحول کو دریافت کرنے، اقدامات کرنے، اور اسے موصول ہونے والے تاثرات کی بنیاد پر اس کے رویے کو مسلسل اپ ڈیٹ کرنے دیتا ہے۔ یہ طریقہ خاص طور پر AI کو گیمز کھیلنے، روبوٹس کو کنٹرول کرنے، اور حال ہی میں بڑے لینگویج ماڈلز کی استدلال کی صلاحیت کو تیز کرنے کی تربیت دینے کے لیے طاقتور ثابت ہوا ہے۔ انسانی تاثرات، یا RLHF سے کمک سیکھنے جیسی تکنیکیں، اب اس بات کا مرکز ہیں کہ کس طرح معروف AI لیبز اپنے ماڈلز کو مزید مددگار، درست اور محفوظ بنانے کے لیے بہتر بناتی ہیں۔

جب بات انسانی مشین مواصلات کی ہو تو، کچھ واضح چیلنجز ہوتے ہیں - لوگ انسانی زبان کا استعمال کرتے ہوئے بات چیت کرتے ہیں، جبکہ AI پروگرام ڈیٹا کے ذریعے مطلع پیچیدہ الگورتھمک عمل کے ذریعے کام انجام دیتے ہیں۔ ٹوکن اس فرق کو پُر کرتے ہیں: وہ انسانی-AI مواصلات کے بنیادی تعمیراتی بلاکس ہیں، جو ڈیٹا کے مجرد حصوں کی نمائندگی کرتے ہیں جن پر LLM کے ذریعے کارروائی یا تیار کیا گیا ہے۔ وہ ٹوکنائزیشن نامی ایک عمل کے ذریعے تخلیق کیے گئے ہیں، جو خام متن کو کاٹنے کے سائز کی اکائیوں میں توڑ دیتا ہے جو ایک زبان کا ماڈل ہضم کر سکتا ہے، جیسا کہ ایک کمپائلر انسانی زبان کا بائنری کوڈ میں ترجمہ کرتا ہے جس طرح کمپیوٹر سمجھ سکتا ہے۔ انٹرپرائز سیٹنگز میں، ٹوکن بھی لاگت کا تعین کرتے ہیں — زیادہ تر AI کمپنیاں LLM کے استعمال کے لیے فی ٹوکن کی بنیاد پر چارج کرتی ہیں، یعنی کاروبار جتنا زیادہ استعمال کرتا ہے، اتنا ہی زیادہ ادائیگی کرتا ہے۔ تو پھر، ٹوکنز متن کے چھوٹے حصے ہیں — اکثر الفاظ کے پورے حصے کے بجائے — جنہیں AI لینگویج ماڈلز زبان کو پروسیس کرنے سے پہلے توڑ دیتے ہیں۔ وہ AI کام کے بوجھ کو سمجھنے کے مقاصد کے لیے تقریباً "الفاظ" کے مشابہ ہیں۔ تھرو پٹ سے مراد یہ ہے کہ ایک مقررہ مدت میں کتنا عمل کیا جا سکتا ہے، لہذا ٹوکن تھرو پٹ بنیادی طور پر اس بات کا پیمانہ ہے کہ ایک سسٹم ایک ساتھ کتنا AI کام کر سکتا ہے۔ AI انفراسٹرکچر ٹیموں کے لیے ہائی ٹوکن تھرو پٹ ایک کلیدی ہدف ہے، کیونکہ یہ اس بات کا تعین کرتا ہے کہ ایک ماڈل کتنے صارفین کو بیک وقت خدمت کر سکتا ہے اور ان میں سے ہر ایک کو کتنی جلدی جواب ملتا ہے۔ اے آئی کے محقق آندریج کارپاتھی نے اضطراب کے احساس کو بیان کیا ہے جب ان کی AI سبسکرپشنز بیکار رہتی ہیں - اس احساس کی بازگشت جس میں وہ ایک گریڈ کے طالب علم کے طور پر محسوس کرتے تھے جب مہنگے کمپیوٹر ہارڈویئر کا پوری طرح سے استعمال نہیں کیا جا رہا تھا - ایک ایسا جذبہ جو اس بات کو پکڑتا ہے کہ ٹوکن تھرو پٹ کو زیادہ سے زیادہ کرنا کیوں میدان میں ایک جنون بن گیا ہے۔

مشین لرننگ AIs تیار کرنے میں ایک عمل شامل ہوتا ہے جسے تربیت کہا جاتا ہے۔ سادہ الفاظ میں، اس سے مراد ڈیٹا کو فیڈ کیا جا رہا ہے تاکہ ماڈل پیٹرن سے سیکھ سکے اور مفید نتائج پیدا کر سکے۔ بنیادی طور پر، یہ ڈیٹا میں موجود خصوصیات کا جواب دینے والے نظام کا عمل ہے جو اسے مطلوبہ مقصد کے لیے آؤٹ پٹ کو اپنانے کے قابل بناتا ہے — چاہے وہ بلیوں کی تصویروں کی شناخت ہو یا مطالبہ پر ہائیکو تیار کرنا۔

ٹریننگ مہنگی ہو سکتی ہے کیونکہ اس کے لیے بہت سارے ان پٹس کی ضرورت ہوتی ہے، اور مطلوبہ حجم اوپر کی طرف بڑھ رہا ہے - یہی وجہ ہے کہ ہائبرڈ اپروچز، جیسے کہ ٹارگیٹڈ ڈیٹا کے ساتھ قواعد پر مبنی AI کو ٹھیک کرنا، شروع سے مکمل طور پر شروع کیے بغیر لاگت کا انتظام کرنے میں مدد کر سکتا ہے۔

[دیکھیں: تخمینہ]

ایک ایسی تکنیک جہاں پہلے سے تربیت یافتہ AI ماڈل کو ایک مختلف لیکن عام طور پر متعلقہ کام کے لیے ایک نیا ماڈل تیار کرنے کے نقطہ آغاز کے طور پر استعمال کیا جاتا ہے - جس سے پچھلے تربیتی چکروں میں حاصل کردہ علم کو دوبارہ لاگو کیا جا سکے۔

ٹرانسفر لرننگ ماڈل ڈیولپمنٹ کو شارٹ کٹ کرکے کارکردگی کی بچت کر سکتی ہے۔ یہ اس وقت بھی کارآمد ثابت ہو سکتا ہے جب اس کام کا ڈیٹا جس کے لیے ماڈل تیار کیا جا رہا ہے کچھ محدود ہو۔ لیکن یہ نوٹ کرنا ضروری ہے کہ نقطہ نظر کی حدود ہیں۔ وہ ماڈل جو عمومی صلاحیتوں کو حاصل کرنے کے لیے ٹرانسفر لرننگ پر انحصار کرتے ہیں، ان کو ممکنہ طور پر اضافی ڈیٹا کی تربیت کی ضرورت ہوگی تاکہ وہ اپنے فوکس کے شعبے میں اچھی کارکردگی کا مظاہرہ کریں۔

(دیکھیں: فائن ٹیوننگ)

توثیق کا نقصان ایک ایسا نمبر ہے جو آپ کو بتاتا ہے کہ تربیت کے دوران ایک AI ماڈل کتنی اچھی طرح سے سیکھ رہا ہے — اور کم بہتر ہے۔ محققین اسے ایک قسم کے ریئل ٹائم رپورٹ کارڈ کے طور پر قریب سے ٹریک کرتے ہیں، اس کا استعمال یہ فیصلہ کرنے کے لیے کرتے ہیں کہ تربیت کب روکنی ہے، کب ہائپر پِیرامیٹر کو ایڈجسٹ کرنا ہے، یا کسی ممکنہ مسئلے کی تحقیقات کرنی ہیں۔ اہم خدشات میں سے ایک جس سے یہ پرچم کو اوور فٹنگ میں مدد دیتا ہے، ایک ایسی حالت جس میں ماڈل اپنے تربیتی ڈیٹا کو صحیح معنوں میں سیکھنے کے نمونوں کے بجائے حفظ کرتا ہے جو اسے نئے حالات میں عام کر سکتا ہے۔ اس کو ایک ایسے طالب علم کے درمیان فرق کے طور پر سوچیں جو حقیقی طور پر مواد کو سمجھتا ہے اور جس نے پچھلے سال کے امتحان کو صرف حفظ کیا تھا — توثیق کے نقصان سے یہ ظاہر کرنے میں مدد ملتی ہے کہ آپ کا ماڈل کون سا بن رہا ہے۔

وزن AI ٹریننگ کے لیے بنیادی ہیں، کیونکہ وہ اس بات کا تعین کرتے ہیں کہ سسٹم کی تربیت کے لیے استعمال کیے جانے والے ڈیٹا میں مختلف فیچرز (یا ان پٹ متغیرات) کو کتنی اہمیت (یا وزن) دی جاتی ہے - اس طرح AI ماڈل کے آؤٹ پٹ کی تشکیل ہوتی ہے۔

دوسرے طریقے سے دیکھیں، وزن عددی پِیرامیٹرز ہیں جو اس بات کی وضاحت کرتے ہیں کہ دیے گئے تربیتی کام کے لیے ڈیٹاسیٹ میں سب سے نمایاں کیا ہے۔ وہ ان پٹ پر ضرب لگا کر اپنا کام حاصل کرتے ہیں۔ ماڈل ٹریننگ عام طور پر ان وزنوں سے شروع ہوتی ہے جو تصادفی طور پر تفویض کیے جاتے ہیں، لیکن جیسے جیسے یہ عمل سامنے آتا ہے، وزن ایڈجسٹ ہو جاتا ہے کیونکہ ماڈل کسی ایسے آؤٹ پٹ پر پہنچنے کی کوشش کرتا ہے جو ہدف سے زیادہ میل کھاتا ہو۔

مثال کے طور پر، مکانات کی قیمتوں کی پیشین گوئی کرنے کے لیے ایک AI ماڈل جو کہ کسی ہدف والے مقام کے لیے تاریخی رئیل اسٹیٹ ڈیٹا پر تربیت یافتہ ہے اس میں بیڈ رومز اور باتھ رومز کی تعداد، چاہے کوئی پراپرٹی الگ ہو یا نیم علیحدہ ہو، چاہے اس میں پارکنگ ہو، گیراج وغیرہ وغیرہ۔

بالآخر، ماڈل ان میں سے ہر ایک کے ساتھ جو وزن جوڑتا ہے وہ اس بات کی عکاسی کرتا ہے کہ وہ دیئے گئے ڈیٹاسیٹ کی بنیاد پر کسی پراپرٹی کی قدر کو کتنا متاثر کرتے ہیں۔

اس مضمون کو نئی معلومات کے ساتھ باقاعدگی سے اپ ڈیٹ کیا جاتا ہے۔