مصنوعي ذهانت دنيا کي تبديل ڪري رهي آهي، ۽ انهي سان گڏ هڪ مڪمل نئين ٻولي ايجاد ڪري ٿي بيان ڪرڻ لاءِ ته اهو ڪيئن ڪري رهيو آهي. AI بابت پڙهڻ ۾ پنج منٽ خرچ ڪريو ۽ توهان LLMs، RAG، RLHF، ۽ درجنين ٻين شرطن ۾ داخل ٿي ويندا جيڪي ٽيڪنالاجي جي دنيا ۾ تمام هوشيار ماڻهن کي به غير محفوظ محسوس ڪري سگھن ٿا. هي لغت اسان جي ڪوشش آهي انهي کي درست ڪرڻ جي. اسان ان کي باقاعده طور تي اپڊيٽ ڪندا آهيون جيئن فيلڊ ترقي ڪري ٿي، تنهنڪري ان کي هڪ زنده دستاويز سمجهيو، گهڻو ڪري AI سسٽم وانگر اهو بيان ڪري ٿو.

مصنوعي جنرل انٽيليجنس، يا AGI، هڪ غير معمولي اصطلاح آهي. پر اهو عام طور تي AI ڏانهن اشارو ڪري ٿو جيڪو اوسط انسان کان وڌيڪ قابل آهي ڪيترن ئي، جيڪڏهن گهڻو ڪري، ڪمن ۾. OpenAI CEO Sam Altman هڪ دفعو AGI کي بيان ڪيو آهي "هڪ وچين انسان جي برابر آهي ته توهان هڪ همراهه طور تي نوڪري ڪري سگهو ٿا." ان کان علاوه، OpenAI جو چارٽر AGI جي طور تي بيان ڪري ٿو "انتهائي خودمختيار نظام جيڪي انسانن کي تمام گهڻو اقتصادي طور تي قيمتي ڪم تي ختم ڪن ٿا." گوگل ڊيپ مائنڊ جي سمجھ انهن ٻن وصفن کان ٿورو مختلف آهي؛ ليب AGI کي ڏسي ٿي "AI جيڪا گهٽ ۾ گهٽ ايتري قابل آهي جيترو انسانن جي تمام گهڻي سنجيدگي واري ڪمن ۾." مونجهارو؟ پريشان ٿيڻ جي ضرورت ناهي - تنهن ڪري ماهر آهن AI ريسرچ جي اڳيان.

هڪ AI ايجنٽ هڪ اوزار ڏانهن اشارو ڪري ٿو جيڪو توهان جي طرفان ڪمن جو هڪ سلسلو انجام ڏيڻ لاءِ AI ٽيڪنالاجيون استعمال ڪري ٿو - ان کان سواءِ جيڪو وڌيڪ بنيادي AI چيٽ بوٽ ڪري سگهي ٿو - جيئن فائلنگ خرچ ، بکنگ ٽڪيٽون يا ريسٽورنٽ تي ٽيبل ، يا ڪوڊ لکڻ ۽ برقرار رکڻ پڻ. تنهن هوندي، جيئن اسان اڳ ۾ وضاحت ڪئي آهي، اتي تمام گھڻا ٽڪرا ٽڪرا ٽڪرا هن هنگامي جاء ۾، تنهنڪري "AI ايجنٽ" جو مطلب مختلف ماڻهن لاء مختلف شيون ٿي سگهي ٿو. انفراسٽرڪچر اڃا تائين تعمير ڪيو پيو وڃي ته جيئن ان جي تجويز ڪيل صلاحيتن کي پورو ڪري سگهجي. پر بنيادي تصور هڪ خودمختيار نظام جو مطلب آهي جيڪو ڪيترن ئي AI سسٽم تي ٺاهي سگھي ٿو ڪيترن ئي ڪمن کي انجام ڏيڻ لاء.

سافٽ ويئر جي هڪ ٽڪري جي پٺي تي API جي آخر پوائنٽس کي ”بٽن“ جي طور تي سوچيو ته ٻيا پروگرام ان کي ڪم ڪرڻ لاءِ دٻائي سگهن ٿا. ڊولپرز اهي انٽرفيس استعمال ڪن ٿا انٽيگريشن ٺاهڻ لاءِ - مثال طور، هڪ ايپليڪيشن کي ٻئي کان ڊيٽا ڪڍڻ جي اجازت ڏيڻ، يا AI ايجنٽ کي فعال ڪرڻ لاءِ ٽئين پارٽي جي خدمتن کي ڪنٽرول ڪرڻ لاءِ سڌو سنئون انساني طور تي هر انٽرفيس کي هلائڻ کان سواءِ. گهڻيون سمارٽ گهر ڊوائيسز ۽ ڳنڍيل پليٽ فارمن تي اهي پوشیدہ بٽڻ موجود آهن، جيتوڻيڪ عام صارف انهن سان ڪڏهن به نه ڏسندا آهن يا انهن سان رابطو نه ڪندا آهن. جيئن ته AI ايجنٽ وڌيڪ قابل ٿي ويندا آهن، اهي وڌندا آهن ڳولڻ ۽ استعمال ڪرڻ جي قابل هوندا اهي آخري نقطا پنهنجو پاڻ تي، کولڻ طاقتور - ۽ ڪڏهن ڪڏهن غير متوقع - خودڪار لاءِ امڪان.

هڪ سادي سوال جي حوالي سان، هڪ انساني دماغ ان جي باري ۾ گهڻو سوچڻ کان سواء جواب ڏئي سگهي ٿو - شيون جهڙوڪ "ڪهڙو جانور ڊگهو آهي، زراف يا ٻلي؟" پر ڪيترين ئي صورتن ۾، توهان کي صحيح جواب ڏيڻ لاءِ اڪثر قلم ۽ ڪاغذ جي ضرورت پوندي آهي ڇو ته اتي وچولي مرحلا آهن. مثال طور، جيڪڏهن هڪ هاريءَ وٽ ڪڪڙ ۽ ڳئون آهن، ۽ انهن سان گڏ 40 مٿا ۽ 120 ٽنگون آهن، ته توهان کي جواب ڏيڻ لاءِ هڪ سادي مساوات لکڻ جي ضرورت پوندي (20 ڪڪڙ ۽ 20 ڳئون).

هڪ AI حوالي سان، وڏي ٻوليءَ جي ماڊلز لاءِ چين جي سوچ جي دليل جو مطلب آهي هڪ مسئلي کي ننڍڙن، وچولي قدمن ۾ ٽوڙڻ لاءِ آخري نتيجن جي معيار کي بهتر ڪرڻ لاءِ. اهو عام طور تي هڪ جواب حاصل ڪرڻ ۾ گهڻو وقت وٺندو آهي، پر جواب صحيح هجڻ جو وڌيڪ امڪان آهي، خاص طور تي هڪ منطق يا ڪوڊنگ جي حوالي سان. استدلال جا ماڊل روايتي وڏي ٻوليءَ جي ماڊلز مان تيار ڪيا ويا آهن ۽ مضبوط سکيا جي مهرباني سان چين جي سوچ واري سوچ لاءِ بهتر ڪيا ويا آهن.

(ڏسو: وڏي ٻولي ماڊل)

اهو هڪ وڌيڪ مخصوص تصور آهي ته هڪ ”AI ايجنٽ“، جنهن جو مطلب آهي هڪ پروگرام جيڪو پنهنجي طور تي قدم کڻي سگهي ٿو، هڪ مقصد کي پورو ڪرڻ لاءِ. هڪ ڪوڊنگ ايجنٽ سافٽ ويئر ڊولپمينٽ تي لاڳو ڪيل هڪ خاص نسخو آهي. بجاءِ صرف هڪ انسان کي جائزو وٺڻ ۽ پيسٽ ڪرڻ لاءِ ڪوڊ تجويز ڪرڻ جي، هڪ ڪوڊنگ ايجنٽ لکي، ٽيسٽ، ۽ ڊيبگ ڪوڊ خودمختياري ڪري سگهي ٿو، اهڙي قسم جي تکراري، آزمائشي ۽ غلطي واري ڪم کي سنڀاليندو جيڪو عام طور تي ڊولپر جو ڏينهن استعمال ڪري ٿو. اهي ايجنٽ سڄي ڪوڊ بيسز تي ڪم ڪري سگهن ٿا، ڪيچ کي نشانو بڻائڻ، ٽيسٽ هلائڻ، ۽ گهٽ ۾ گهٽ انساني نگراني سان درست ڪرڻ کي زور ڏيڻ. ان جي باري ۾ سوچيو جيئن هڪ تمام تيز انٽرن کي ڀرتي ڪرڻ جيڪو ڪڏهن به ننڊ نه ڪندو آهي ۽ ڪڏهن به ڌيان نه وڃائيندو آهي - جيتوڻيڪ، ڪنهن به انٽرن وانگر، هڪ انسان کي اڃا تائين ڪم جو جائزو وٺڻ جي ضرورت آهي. جيتوڻيڪ ڪنهن حد تائين هڪ گھڻائي وارو اصطلاح، ڳڻپيوڪر عام طور تي اهم ڪمپيوٽيشنل پاور ڏانهن اشارو ڪري ٿو جيڪا AI ماڊل کي هلائڻ جي اجازت ڏئي ٿي. اهڙي قسم جي پروسيسنگ AI صنعت کي ٻارڻ ڏئي ٿي، ان کي تربيت ڏيڻ ۽ ان جي طاقتور ماڊل کي ترتيب ڏيڻ جي صلاحيت ڏئي ٿي. اصطلاح اڪثر ڪري هارڊويئر جي قسمن لاءِ شارٽ هيننڊ هوندو آهي جيڪو مهيا ڪري ٿو ڪمپيوٽيشنل پاور - شيون جهڙوڪ GPUs، CPUs، TPUs، ۽ انفراسٽرڪچر جا ٻيا فارم جيڪي جديد AI صنعت جو بنياد بڻجن ٿا.

خود سڌارڻ واري مشين جي سکيا جو هڪ ذيلي سيٽ جنهن ۾ AI الگورٿمز هڪ گھڻن سطحن سان ٺهيل آهن، مصنوعي نيورل نيٽورڪ (ANN) ساخت. اهو انهن کي آسان مشين لرننگ تي ٻڌل سسٽم جي مقابلي ۾ وڌيڪ پيچيده لاڳاپن ٺاهڻ جي اجازت ڏئي ٿو، جهڙوڪ لينر ماڊل يا فيصلي واري وڻ. گہرے سکيا واري الگورتھم جي جوڙجڪ انساني دماغ ۾ نيورسن جي باہم ڳنڍيل رستن کان متاثر ٿي.

ڊيپ لرننگ AI ماڊل پاڻ ۾ ڊيٽا ۾ اهم خاصيتن کي سڃاڻڻ جي قابل آهن، بلڪه انساني انجنيئرن کي انهن خاصيتن جي وضاحت ڪرڻ جي ضرورت آهي. ڍانچي الورورٿمس کي پڻ سپورٽ ڪري ٿو جيڪي غلطين مان سکن ٿا ۽، ورجائي ۽ ترتيب ڏيڻ جي عمل ذريعي، انهن جي پنهنجي پيداوار کي بهتر بڻائي ٿو. جڏهن ته، گہرے سکيا وارو نظام سٺا نتيجا حاصل ڪرڻ لاءِ ڪيترن ئي ڊيٽا پوائنٽن جي ضرورت آهي (لکين يا وڌيڪ). اهي پڻ عام طور تي وڌيڪ وقت وٺن ٿا ٽريننگ ۾ آسان مشين لرننگ الگورٿمز جي مقابلي ۾ - تنهنڪري ترقي جي قيمت وڌيڪ هوندي آهي.

(ڏسو: نيورل نيٽ ورڪ)

Diffusion ڪيترن ئي آرٽ، ميوزڪ-، ۽ ٽيڪسٽ پيدا ڪندڙ AI ماڊلز جي دل تي ٽيڪ آهي. فزڪس کان متاثر ٿي، ڊفيوشن سسٽم آهستگي سان ڊيٽا جي جوڙجڪ کي ”تباه“ ڪن ٿا- مثال طور، فوٽو، گانا، وغيره- شور شامل ڪندي جيستائين ڪجھ به نه بچيو. فزڪس ۾، ڦهلاءُ spontaneous ۽ ناقابل واپسي آهي - ڪافي ۾ ڦهليل کنڊ کي ڪعبي شڪل ۾ بحال نٿو ڪري سگهجي. پر AI ۾ ڊفيوشن سسٽم جو مقصد آهي "ريورس ڊفيوشن" عمل جو هڪ قسم سکڻ آهي تباهه ٿيل ڊيٽا کي بحال ڪرڻ لاءِ ، ڊيٽا کي شور مان حاصل ڪرڻ جي صلاحيت حاصل ڪرڻ.

Distillation هڪ ٽيڪنڪ آهي جنهن کي استعمال ڪيو ويندو علم کي ڪڍڻ لاءِ وڏي AI ماڊل مان هڪ ’استاد-شاگرد‘ ماڊل سان. ڊولپرز استادن جي ماڊل ڏانهن درخواستون موڪليندا آهن ۽ نتيجن کي رڪارڊ ڪندا آهن. جوابن جو مقابلو ڪڏهن ڪڏهن ڊيٽا سيٽ سان ڪيو ويندو آهي ته ڏسو ته اهي ڪيترا درست آهن. اهي نتيجا پوءِ شاگرد جي ماڊل کي تربيت ڏيڻ لاءِ استعمال ڪيا ويندا آهن، جنهن کي تربيت ڏني ويندي آهي استاد جي رويي جو اندازو لڳائڻ لاءِ.

Distillation استعمال ڪري سگھجي ٿو ھڪڙو ننڍڙو، وڌيڪ ڪارائتو ماڊل ٺاھڻ لاءِ، ھڪڙي وڏي ماڊل جي بنياد تي گھٽ ۾ گھٽ آھستي نقصان سان. اهو ممڪن آهي ته ڪيئن OpenAI ترقي ڪئي GPT-4 ٽربو، GPT-4 جو هڪ تيز ورزن.

جڏهن ته سڀئي AI ڪمپنيون اندروني طور تي استعمال ڪنديون آهن، اهو شايد ڪجهه AI ڪمپنين طرفان استعمال ڪيو ويو آهي فرنٽيئر ماڊلز کي پڪڙڻ لاء. مقابلي کان آسٽليشن عام طور تي AI API ۽ چيٽ اسسٽنٽ جي خدمت جي شرطن جي ڀڃڪڙي ڪري ٿي.

هي هڪ AI ماڊل جي وڌيڪ تربيت ڏانهن اشارو ڪري ٿو وڌيڪ مخصوص ڪم يا علائقي لاءِ ڪارڪردگي کي بهتر ڪرڻ لاءِ جيڪو اڳ ۾ ان جي تربيت جو هڪ مرڪزي نقطو هو - خاص طور تي نئين ، خاص (يعني ٽاسڪ تي مبني) ​​ڊيٽا کي فيڊ ڪندي.

ڪيتريون ئي AI شروعاتون وڏي ٻولي جا ماڊل وٺي رهيا آهن شروعاتي نقطي جي طور تي هڪ تجارتي پراڊڪٽ ٺاهڻ لاءِ پر هڪ ٽارگيٽ شعبي يا ڪم لاءِ افاديت کي وڌائڻ جي ڪوشش ڪري رهيا آهن اڳوڻن تربيتي چڪرن کي مڪمل ڪرڻ سان انهن جي پنهنجي ڊومين جي مخصوص علم ۽ مهارت جي بنياد تي.

(ڏسو: وڏي ٻولي ماڊل [LLM])

A GAN، يا Generative Adversarial Network، مشين لرننگ فريم ورڪ جو هڪ قسم آهي جيڪو generative AI ۾ ڪجهه اهم پيش رفتن کي هٿي ڏئي ٿو جڏهن اهو اچي ٿو حقيقي ڊيٽا پيدا ڪرڻ جي - بشمول (پر نه رڳو) ڊيپ فيڪ اوزار. GANs شامل آهن نيورل نيٽ ورڪ جي هڪ جوڙي جو استعمال، جن مان هڪ ان جي تربيتي ڊيٽا تي ٺاهي ٿو هڪ پيداوار پيدا ڪرڻ لاء جيڪو ٻئي ماڊل ڏانهن منتقل ڪيو ويو آهي جائزو وٺڻ لاء.

ٻه ماڊل لازمي طور تي پروگرام ڪيا ويا آهن هڪ ٻئي کي ختم ڪرڻ جي ڪوشش ڪرڻ لاء. جنريٽر ڪوشش ڪري رهيو آهي ته ان جي پيداوار کي تعصب جي ماضي کان وٺي، جڏهن ته تبعيض ڪندڙ مصنوعي طور تي ٺاهيل ڊيٽا کي هٽائڻ لاء ڪم ڪري رهيو آهي. هي منظم مقابلو اضافي انساني مداخلت جي ضرورت کان سواءِ AI پيداوار کي وڌيڪ حقيقي ٿيڻ لاءِ بهتر ڪري سگهي ٿو. جيتوڻيڪ GANs عام مقصد AI جي بجاءِ تنگ ايپليڪيشنن (جهڙوڪ حقيقي تصويرون يا وڊيوز ٺاهڻ) لاءِ بهترين ڪم ڪن ٿا.

Hallucination AI صنعت جي ترجيحي اصطلاح آھي AI ماڊلز لاءِ شيون ٺاهڻ - لفظي طور تي معلومات پيدا ڪرڻ جيڪا غلط آھي. ظاهر آهي، اهو AI معيار لاء هڪ وڏو مسئلو آهي. Hallucinations پيدا ڪري ٿو GenAI جو نتيجو جيڪو گمراهه ٿي سگهي ٿو ۽ شايد حقيقي زندگي جي خطرن کي به وٺي سگھي ٿو - ممڪن طور تي خطرناڪ نتيجن سان (هڪ صحت جي سوال جي باري ۾ سوچيو جيڪو نقصانڪار طبي مشورو ڏئي ٿو).

AIs ٺاھڻ واري معلومات جو مسئلو تربيتي ڊيٽا ۾ خال جي نتيجي ۾ پيدا ٿيڻ جو خيال آھي. Hallucinations وڌ ۾ وڌ خاص ۽/يا عمودي AI ماڊلز جي طرف ڌڪڻ ۾ مدد ڪري رهيا آهن - يعني ڊومين جي مخصوص AIs جن کي تنگ مهارت جي ضرورت آهي - هڪ طريقي جي طور تي علم جي خلا جي امڪان کي گهٽائڻ ۽ غلط معلومات جي خطرن کي گهٽائڻ جو طريقو.

Inference هڪ AI ماڊل هلائڻ جو عمل آهي. اهو اڳڪٿيون ڪرڻ يا اڳئين ڏٺل ڊيٽا مان نتيجو ڪڍڻ لاءِ ماڊل لوز ڪري رهيو آهي. واضح ٿيڻ لاءِ، تربيت کان سواءِ اندازو نٿو ٿي سگهي. ھڪڙي ماڊل کي ڊيٽا جي ھڪڙي سيٽ ۾ نمونن کي سکڻ گھرجي ان کان اڳ اھو ھن ٽريننگ ڊيٽا مان مؤثر طريقي سان ڪڍي سگھي.

هارڊويئر جا ڪيترائي قسم انفرنس انجام ڏئي سگھن ٿا، سمارٽ فون پروسيسرز کان وٺي بيفي GPUs تائين ڪسٽم-ڊزائن ٿيل AI تيز ڪندڙ. پر نه اهي سڀئي ماڊل هڪجهڙائي سان هلائي سگهن ٿا. تمام وڏا ماڊل اڳڪٿيون ڪرڻ لاءِ عمر وٺندا ، چون ٿا ، هڪ ليپ ٽاپ بمقابله ڪلائوڊ سرور سان گڏ اعليٰ آخر AI چپس.

[ڏسو: تربيت ]

وڏي ٻولي جا ماڊل، يا LLMs، AI ماڊل آھن جيڪي مشهور AI اسسٽنٽ پاران استعمال ڪيا ويندا آھن، جھڙوڪ ChatGPT، Claude، Google’s Gemini، Meta’s AI Llama، Microsoft Copilot، يا Mistral’s Le Chat. جڏهن توهان هڪ AI اسسٽنٽ سان چيٽ ڪريو ٿا، توهان هڪ وڏي ٻولي ماڊل سان رابطو ڪريو ٿا جيڪو توهان جي درخواست کي سڌو سنئون يا مختلف دستياب اوزارن جي مدد سان، جهڙوڪ ويب برائوزنگ يا ڪوڊ ترجمو ڪندڙ.

LLMs بلين عددي پيرا ميٽرز (يا وزن، هيٺ ڏسو) مان ٺهيل گہرا اعصابي نيٽ ورڪ آهن جيڪي لفظن ۽ جملن جي وچ ۾ لاڳاپا سيکاريندا آهن ۽ ٻولي جي نمائندگي ٺاهيندا آهن، لفظن جي هڪ قسم جي گھڻائي نقشي جو هڪ قسم.

اهي ماڊل انڪوڊنگ مان ٺاهيا ويا آهن انهن نمونن کي جيڪي اهي اربين ڪتابن، مضمونن، ۽ نقلن ۾ ڳوليندا آهن. جڏهن توهان هڪ LLM کي فوري طور تي پيش ڪيو ٿا، ماڊل تمام گهڻو ممڪن نمونو ٺاهي ٿو جيڪو فوري طور تي مناسب آهي.

(ڏسو: نيورل نيٽ ورڪ)

ميموري ڪيش هڪ اهم عمل ڏانهن اشارو ڪري ٿو جيڪو انفرنس کي وڌائي ٿو (جيڪو اهو عمل آهي جنهن ذريعي AI صارف جي سوال جو جواب پيدا ڪرڻ لاءِ ڪم ڪري ٿو). جوهر ۾، ڪيشنگ هڪ اصلاحي ٽيڪنڪ آهي، جيڪا وڌيڪ موثر انداز ۾ ترتيب ڏيڻ لاء ٺهيل آهي. AI واضح طور تي تيز آڪٽين رياضياتي حسابن سان هلائي ٿو ۽ هر ڀيري اهي حساب ڪيا وڃن ٿا، اهي وڌيڪ طاقت استعمال ڪن ٿا. ڪيشنگ ٺهيل آهي حسابن جي تعداد کي گھٽائڻ لاءِ هڪ ماڊل کي هلائڻو پوندو خاص حسابن کي محفوظ ڪندي مستقبل جي صارف جي سوالن ۽ عملن لاءِ. ميموري ڪيشنگ جا مختلف قسم آهن، جيتوڻيڪ هڪ وڌيڪ مشهور آهي KV (يا اهم قدر) ڪيشنگ. KV ڪيچنگ ٽرانسفارمر تي ٻڌل ماڊلز ۾ ڪم ڪري ٿي، ۽ ڪارڪردگي وڌائي ٿي، تيزيءَ سان نتيجن کي گھٽائيندي وقت جي مقدار کي گھٽائي ٿي (۽ الورورٿمڪ محنت) جيڪو صارف جي سوالن جا جواب پيدا ڪرڻ ۾ وٺندو آهي.

(ڏسو: حوالو)

هڪ اعصابي نيٽ ورڪ ڪيترن ئي سطحن واري الگورتھمڪ ساخت ڏانهن اشارو ڪري ٿو جيڪا گہرے سکيا کي گهٽائي ٿي - ۽ وڌيڪ وسيع طور تي، وڏي ٻولي ماڊلز جي ظاهر ٿيڻ کانپوءِ پيدا ٿيندڙ AI اوزارن ۾ مڪمل بوم.

جيتوڻيڪ ڊيٽا پروسيسنگ الورورٿمز لاءِ ڊزائين ڍانچي جي طور تي انساني دماغ جي گھڻن باہم ڳنڍيل رستن کان الهام وٺڻ جو خيال 1940ع جي ڏهاڪي تائين آهي، اهو گرافڪ پروسيسنگ هارڊويئر (GPUs) جو تمام گهڻو تازو اڀار هو - وڊيو گيم انڊسٽري ذريعي - جنهن واقعي هن نظريي جي طاقت کي ان لاڪ ڪيو. اهي چپس الورورٿمز کي تربيت ڏيڻ لاءِ مناسب ثابت ٿيون ڪيترن ئي پرتن سان گڏ اڳئين دورن ۾ ممڪن هو - نيورل نيٽ ورڪ تي ٻڌل AI سسٽم کي فعال ڪرڻ لاءِ ڪيترن ئي ڊومينز ۾ تمام گهڻي بهتر ڪارڪردگي حاصل ڪرڻ لاءِ ، بشمول آواز جي سڃاڻپ ، خودمختيار نيويگيشن ، ۽ دوا جي دريافت.

(ڏسو: وڏي ٻولي ماڊل [LLM])

اوپن سورس سافٽ ويئر ڏانهن اشارو ڪري ٿو - يا، وڌندڙ، AI ماڊل - جتي بنيادي ڪوڊ عوامي طور تي دستياب ڪيو ويو آهي هر ڪنهن لاء استعمال ڪرڻ، معائنو ڪرڻ، يا تبديل ڪرڻ لاء. AI دنيا ۾، ميٽا جي لاما خاندان جو ماڊل ھڪڙو نمايان مثال آھي؛ لينڪس مشهور تاريخي متوازي آپريٽنگ سسٽم ۾ آهي. اوپن سورس جا طريقا سڄي دنيا ۾ محققن، ڊولپرز ۽ ڪمپنين کي اجازت ڏين ٿا ته هو هڪ ٻئي جي ڪم جي مٿان تعمير ڪن، ترقي کي تيز ڪن ۽ آزاد حفاظتي آڊٽ کي فعال ڪن جيڪي بند سسٽم آساني سان مهيا نٿا ڪري سگهن. بند ٿيل ماخذ جو مطلب آهي ڪوڊ خانگي آهي - توهان پروڊڪٽ استعمال ڪري سگهو ٿا پر اهو نه ڏسندا ته اهو ڪيئن ڪم ڪري ٿو، جيئن OpenAI جي GPT ماڊلز جو معاملو آهي - هڪ فرق جيڪو AI صنعت ۾ وضاحتي بحثن مان هڪ بڻجي ويو آهي. متوازي ڪرڻ جو مطلب آهي هڪ ئي وقت ۾ ڪيتريون ئي شيون ڪرڻ بجاءِ هڪ کان پوءِ - جهڙوڪ 10 ملازمن جو هڪ ئي وقت ۾ هڪ پروجيڪٽ جي مختلف حصن تي ڪم ڪرڻ بدران هڪ ملازم هر ڪم ترتيب سان ڪري رهيو آهي. AI ۾، متوازي ڪرڻ بنيادي طور تي تربيت ۽ انفرنس ٻنهي لاءِ بنيادي آهي: جديد GPUs خاص طور تي متوازي ۾ هزارين حسابن کي انجام ڏيڻ لاءِ ٺهيل آهن، اهو هڪ وڏو سبب آهي ڇو ته اهي صنعت جي هارڊويئر ريبون بڻجي ويا. جيئن ته AI سسٽم وڌيڪ پيچيده ٿي ويندا آهن ۽ ماڊل وڏا ٿيندا ويندا آهن، ڪيترن ئي چپس ۽ ڪيترن ئي مشينن تي ڪم کي متوازي ڪرڻ جي صلاحيت اهو طئي ڪرڻ ۾ سڀ کان اهم عنصر بڻجي ويو آهي ته ماڊل ڪيئن جلدي ۽ قيمتي اثرائتي نموني ٺاهي ۽ ترتيب ڏئي سگهجن ٿيون. بهتر متوازي حڪمت عملين ۾ تحقيق هاڻي پنهنجي حق ۾ مطالعي جو هڪ ميدان آهي.

RAMageddon ھڪڙو مزيدار نئون اصطلاح آھي ھڪڙو غير مزيدار رجحان لاءِ جيڪو ٽيڪ انڊسٽري کي ڇڪي رھيو آھي: بي ترتيب رسائي ميموري جي ھميشه وڌندڙ گھٽتائي، يا RAM چپس، جيڪا تمام گھڻي طاقت رکي ٿي انھن سڀني ٽيڪ پروڊڪٽس کي جيڪي اسان پنھنجي روزاني زندگيءَ ۾ استعمال ڪندا آھيون. جيئن ته AI صنعت ڦٽي چڪي آهي، سڀ کان وڏي ٽيڪني ڪمپنيون ۽ AI ليبز - سڀ کان وڌيڪ طاقتور ۽ ڪارائتو AI حاصل ڪرڻ جي خواهشمند آهن - انهن جي ڊيٽا سينٽرن کي طاقت ڏيڻ لاءِ ايتري رام خريد ڪري رهيا آهن جو اسان جي باقي لاءِ گهڻو ڪجهه ناهي بچيو. ۽ انهي سپلائي جي رڪاوٽ جو مطلب آهي ته ڇا بچيو آهي وڌيڪ ۽ وڌيڪ مهانگو ٿي رهيو آهي.

ان ۾ صنعتون شامل آهن گيمنگ (جتي وڏين ڪمپنين کي ڪنسولز تي قيمتون وڌائڻيون پونديون آهن ڇاڪاڻ ته انهن جي ڊوائيسز لاءِ ميموري چپس ڳولڻ مشڪل آهي)، ڪنزيومر اليڪٽرانڪس (جتي ياداشت جي کوٽ سبب ٿي سگهي ٿي سمارٽ فون جي ترسيل ۾ هڪ ڏهاڪي کان وڌيڪ عرصي ۾ سڀ کان وڏو ڊپ)، ۽ جنرل انٽرپرائز ڪمپيوٽنگ (ڇاڪاڻ ته اهي ڪمپنيون پنهنجي ڊيٽا سينٽرن لاءِ ڪافي ريم حاصل نه ٿيون ڪري سگهن). قيمتن ۾ اضافو صرف خوفناڪ قلت ختم ٿيڻ کان پوءِ بند ٿيڻ جي اميد رکي ٿو پر ، بدقسمتي سان ، واقعي واقعي ڪا نشاني ناهي جيڪا ڪنهن به وقت جلد ٿيڻ واري آهي.

AGI وانگر، بار بار خود سڌارڻ هڪ حد آهي ته ڪيئن سمارٽ AI حاصل ڪري سگهي ٿي، ۽ اهو انسانن تي ڪيترو ئي انحصار ڪري سگهي ٿو. RSI جي منظرنامي ۾، AI ماڊل پاڻ کي بهتر ڪرڻ شروع ڪن ٿا انساني مداخلت کان سواءِ، صلاحيتون ۽ خودمختياري ۾ وڏي تيزيءَ جي ڪري. ڪجھ چوڻين ۾، اھو ھڪڙو تباھي وارو لمحو ھوندو جيڪو انفراديت جي برابر ھوندو، ھڪڙو لمحو جڏھن AI ماڊل ٻاھرين مداخلت کان محفوظ ٿي ويندا آھن. پر RSI پڻ هڪ بنيادي صلاحيت بيان ڪري ٿو - ڇا هڪ AI ماڊل پنهنجو جانشين ٺاهي سگهي ٿو؟ - جيڪو انجنيئرن لاءِ ان کي ٺاهڻ جي ڪوشش ڪرڻ تمام آسان بڻائي ٿو. ڪيترن ئي تازيون AI شروعاتون مقرر ڪيون ويون آهن ته پاڻ کي بهتر ڪرڻ وارا ماڊل ٺاهڻ لاءِ ، پر انهن مان گھڻا apocalyptic اثرن کي رد ڪن ٿا ، RSI کي صرف تحقيق لاءِ ايندڙ فرنٽيئر طور پيش ڪن ٿا.

Reinforcement learning AI ٽريننگ جو هڪ طريقو آهي جتي هڪ نظام سکي ٿو شين کي آزمائي ۽ صحيح جوابن لاءِ انعام حاصل ڪري- جيئن پنهنجي پياري پالتو جانور کي علاج سان ٽريننگ ڏيڻ، سواءِ هن منظرنامي ۾ ”پالتو“ هڪ نيورل نيٽ ورڪ آهي ۽ ”علاج“ هڪ رياضياتي سگنل آهي جيڪو ڪاميابي جي نشاندهي ڪري ٿو. نگراني ٿيل سکيا جي برعڪس، جتي هڪ ماڊل کي ليبل ٿيل مثالن جي هڪ مقرر ڪيل ڊيٽا سيٽ تي تربيت ڏني ويندي آهي، تقويٰ جي سکيا هڪ ماڊل کي ان جي ماحول کي ڳولڻ، عمل ڪرڻ، ۽ مسلسل پنهنجي رويي کي اپڊيٽ ڪرڻ جي اجازت ڏئي ٿي جيڪا ان کي ملي ٿي. اهو طريقو خاص طور تي طاقتور ثابت ٿيو آهي AI کي تربيت ڏيڻ لاءِ رانديون کيڏڻ، ڪنٽرول روبوٽس، ۽، تازو، وڏي ٻوليءَ جي ماڊلز جي استدلال جي صلاحيت کي تيز ڪرڻ. ٽيڪنڪس جهڙوڪ انساني راءِ کان مضبوطي جي سکيا، يا RLHF، هاڻي مرڪزي آهي ته ڪيئن معروف AI ليبز پنهنجي ماڊل کي وڌيڪ مددگار، صحيح ۽ محفوظ بڻائڻ لاءِ بهتر بڻائين ٿيون.

جڏهن اهو اچي ٿو انساني-مشين مواصلات، اتي ڪجهه واضح چئلينج آهن - ماڻهو انساني ٻولي استعمال ڪندي گفتگو ڪندا آهن، جڏهن ته AI پروگرام ڊيٽا جي ذريعي ڄاڻايل پيچيده الگورتھمڪ پروسيس ذريعي ڪمن کي انجام ڏيندا آهن. ٽوڪن ان خال کي پورو ڪن ٿا: اهي انساني-AI ڪميونيڪيشن جا بنيادي بلڊنگ بلاڪ آهن، ڊيٽا جي ڌار ڌار حصن جي نمائندگي ڪن ٿا جيڪي LLM پاران پروسيس يا تيار ڪيا ويا آهن. اهي ٽوڪنائيزيشن نالي هڪ پروسيس ذريعي ٺاهيا ويا آهن، جيڪي خام متن کي ٽوڪن جي سائز جي يونٽن ۾ ٽوڙيندا آهن هڪ ٻولي جو ماڊل هضم ڪري سگهي ٿو، ساڳي طرح هڪ ڪمپيلر انساني ٻولي کي بائنري ڪوڊ ۾ ترجمو ڪري ٿو جيڪو ڪمپيوٽر سمجهي سگهي ٿو. انٽرپرائز سيٽنگن ۾، ٽوڪن به قيمت جو تعين ڪندا آهن - اڪثر AI ڪمپنيون LLM استعمال لاءِ في ٽوڪن جي بنياد تي چارج ڪنديون آهن، مطلب ته جيترو وڌيڪ ڪاروبار استعمال ڪندو آهي، اوترو ئي اهو ادا ڪندو آهي. پوءِ ٻيهر، ٽوڪن متن جا ننڍا ٽڪرا آهن - اڪثر لفظن جا حصا بلڪه مڪمل لفظن جي - جيڪي AI ٻولي جا ماڊل ان کي پروسيس ڪرڻ کان پهريان ٻولي کي ٽوڙيندا آهن؛ اهي AI ڪم لوڊ کي سمجهڻ جي مقصدن لاءِ ”لفظن“ سان لڳ ڀڳ هڪجهڙا آهن. Throughput انهي ڳالهه ڏانهن اشارو ڪري ٿو ته ڏنل وقت ۾ ڪيترو پروسيس ڪري سگهجي ٿو، تنهنڪري ٽوڪن ذريعي پُٽ لازمي طور تي هڪ ماپ آهي ته ڪيترو AI ڪم هڪ سسٽم هڪ ڀيرو سنڀالي سگهي ٿو. AI انفراسٽرڪچر ٽيمن لاءِ اعليٰ ٽوڪن ذريعي هڪ اهم مقصد آهي، ڇاڪاڻ ته اهو طئي ڪري ٿو ته ڪيترا صارف هڪ ماڊل هڪ ئي وقت خدمت ڪري سگهن ٿا ۽ انهن مان هر هڪ کي ڪيترو جلدي جواب ملي ٿو. AI محقق Andrej Karpathy بيان ڪيو آهي پريشاني جي احساس کي جڏهن هن جي AI سبسڪرپشنون بيڪار بيٺيون آهن - انهي احساس جي گونج ڪندي هن کي هڪ گريجوئيٽ شاگرد جي حيثيت سان جڏهن مهانگو ڪمپيوٽر هارڊويئر مڪمل طور تي استعمال نه ڪيو پيو وڃي - هڪ جذبو جيڪو پڪڙي ٿو ته ٽوڪن ذريعي وڌ کان وڌ ڪرڻ هڪ جنون بڻجي ويو آهي فيلڊ ۾.

مشين لرننگ AIs کي ترقي ڪرڻ ۾ ھڪڙو عمل شامل آھي جيڪو ٽريننگ طور سڃاتو وڃي ٿو. سادي اصطلاحن ۾، هي ڊيٽا کي فيڊ ڪيو پيو وڃي ته جيئن ماڊل نمونن مان سکن ۽ مفيد پيداوار پيدا ڪري سگھن. بنيادي طور تي، اهو سسٽم جو عمل آهي جيڪو ڊيٽا ۾ موجود خاصيتن جو جواب ڏئي ٿو جيڪو ان کي قابل بنائي ٿو ته آئوٽ پُٽ کي گهربل مقصد لاءِ ترتيب ڏئي - ڇا اهو آهي ٻلين جي تصويرن جي نشاندهي ڪرڻ يا مطالبن تي هڪ هائيڪو پيدا ڪرڻ.

ٽريننگ مهانگي ٿي سگهي ٿي ڇاڪاڻ ته ان لاءِ تمام گهڻين انپٽس جي ضرورت آهي، ۽ گهربل مقدار مٿي ڏانهن وڌي رهي آهي - اهو ئي سبب آهي ته هائبرڊ طريقا، جيئن ته حدف ٿيل ڊيٽا سان قاعدن جي بنياد تي AI کي ٺيڪ ڪرڻ، خرچن کي منظم ڪرڻ ۾ مدد ڪري سگهي ٿو مڪمل طور تي شروع کان بغير.

[ڏسو: اندازو ]

هڪ ٽيڪنڪ جتي اڳواٽ تربيت يافته AI ماڊل استعمال ڪيو ويندو آهي شروعاتي نقطي جي طور تي هڪ نئين ماڊل کي ترقي ڪرڻ لاءِ مختلف پر عام طور تي لاڳاپيل ڪم لاءِ - اڳئين تربيتي چڪر ۾ حاصل ڪيل علم کي ٻيهر لاڳو ڪرڻ جي اجازت ڏئي ٿو.

ٽرانسفر لرننگ ماڊل ڊولپمينٽ کي شارٽ ڪٽ ڪندي ڪارڪردگي جي بچت کي ڊرائيو ڪري سگھي ٿو. اهو پڻ ڪارائتو ٿي سگهي ٿو جڏهن ڪم لاءِ ڊيٽا جيڪا ماڊل ترقي ڪئي پئي وڃي ڪجهه حد تائين محدود آهي. پر اهو نوٽ ڪرڻ ضروري آهي ته طريقي سان حدون آهن. ماڊل جيڪي عام صلاحيتون حاصل ڪرڻ لاءِ سکيا جي منتقلي تي ڀاڙين ٿا انهن کي شايد اضافي ڊيٽا تي ٽريننگ جي ضرورت پوندي ته جيئن انهن جي توجه جي ڊومين ۾ سٺي نموني ڪم ڪري سگهجي.

(ڏسو: فائن ٽيوننگ)

تصديق جو نقصان هڪ نمبر آهي جيڪو توهان کي ٻڌائي ٿو ته تربيت دوران هڪ AI ماڊل ڪيتري سٺي سکيا آهي - ۽ گهٽ بهتر آهي. محقق ان کي ويجهي طريقي سان ٽريڪ ڪندا آهن هڪ قسم جي حقيقي وقت جي رپورٽ ڪارڊ جي طور تي، ان کي استعمال ڪندي اهو فيصلو ڪرڻ لاءِ ته ٽريننگ کي ڪڏهن روڪيو وڃي، ڪڏهن هائپرپراميٽر کي ترتيب ڏيڻ، يا ڪنهن امڪاني مسئلي جي تحقيق ڪرڻ لاءِ. اهم خدشات مان هڪ اها مدد ڪري ٿي پرچم کي اوورفٽ ڪرڻ، هڪ شرط جنهن ۾ هڪ ماڊل پنهنجي تربيتي ڊيٽا کي ياد ڪري ٿو بلڪه حقيقي طور تي سکيا جي نمونن جي بدران اهو نئين حالتن کي عام ڪري سگهي ٿو. ان جي باري ۾ سوچيو ته هڪ شاگرد جي وچ ۾ فرق جيڪو حقيقي طور تي مواد کي سمجهي ٿو ۽ هڪ جيڪو صرف گذريل سال جي امتحان کي ياد ڪري ٿو - تصديق جي نقصان کي ظاهر ڪرڻ ۾ مدد ڪري ٿي ته توهان جو نمونو ڪهڙو ٿي رهيو آهي.

وزن AI ٽريننگ لاءِ بنيادي آهن، جيئن اهي طئي ڪن ٿا ته ڪيتري اهميت (يا وزن) مختلف خاصيتن (يا ان پٽ متغيرن) کي ڏني وئي آهي ڊيٽا ۾ جيڪي سسٽم کي تربيت ڏيڻ لاءِ استعمال ڪيا ويا آهن - اهڙي طرح اي آءِ ماڊل جي پيداوار کي شڪل ڏيڻ.

ٻيو طريقو رکو، وزن عددي پيٽرولر آهن جيڪي بيان ڪن ٿا ته ڏنل تربيتي ڪم لاءِ ڊيٽا سيٽ ۾ سڀ کان وڌيڪ نمايان ڇا آهي. اهي ان پٽ تي ضرب لاڳو ڪندي پنهنجو ڪم حاصل ڪن ٿا. ماڊل ٽريننگ عام طور تي وزن سان شروع ٿئي ٿي جيڪي بي ترتيب طور تي مقرر ڪيا ويا آهن، پر جيئن اهو عمل ظاهر ٿئي ٿو، وزن ترتيب ڏئي ٿو جيئن ماڊل هڪ پيداوار تي پهچڻ جي ڪوشش ڪري ٿو جيڪا وڌيڪ ويجهي حدف سان ملائي ٿي.

مثال طور، هڪ AI ماڊل هائوسنگ جي قيمتن جي اڳڪٿي ڪرڻ لاءِ جيڪو تاريخي ريئل اسٽيٽ ڊيٽا تي ٽريننگ ڪيو ويو آهي هڪ ٽارگيٽ مقام لاءِ فيچرز لاءِ وزن شامل ڪري سگھي ٿو جهڙوڪ بيڊ روم ۽ غسل خانو جو تعداد، ڇا ملڪيت الڳ ٿيل آهي يا نيم الڳ، ڇا ان ۾ پارڪنگ آهي، گيراج وغيره.

بالآخر، وزن جو ماڊل انهن مان هر هڪ سان ڳنڍيندو آهي ظاهر ڪري ٿو ته اهي ڏنل ڊيٽا سيٽ جي بنياد تي، ملڪيت جي قيمت تي ڪيترو اثر انداز ڪن ٿا.

هي آرٽيڪل نئين معلومات سان باقاعده اپڊيٽ ڪيو ويندو آهي.