مصنوعي استخبارات نړۍ بدلوي، او په ورته وخت کې یوه نوې ژبه ایجاد کوي ترڅو تشریح کړي چې دا څنګه کوي. پنځه دقیقې د AI په اړه لوستلو کې مصرف کړئ او تاسو به LLMs، RAG، RLHF، او یو درجن نورو شرایطو ته ورسیږئ چې کولی شي حتی د ټیکنالوژۍ نړۍ کې خورا هوښیار خلک د ناامنۍ احساس وکړي. دا لغت زموږ هڅه ده چې دا حل کړو. موږ دا په منظم ډول تازه کوو لکه څنګه چې ساحه وده کوي، نو دا یو ژوندی سند په پام کې ونیسئ، د AI سیسټمونو په څیر چې دا یې تشریح کوي. مصنوعي عمومي استخبارات، یا AGI، یو ناپاک اصطلاح ده. مګر دا عموما AI ته اشاره کوي چې په ډیری کې د اوسط انسان په پرتله ډیر وړتیا لري، که ډیری نه وي، دندې. د OpenAI CEO سیم الټمن یوځل AGI د "میډین انسان سره مساوي په توګه تشریح کړ چې تاسو کولی شئ د همکار په توګه وګمارل شي." په ورته وخت کې، د OpenAI منشور AGI د "خورا خپلواکه سیسټمونو په توګه تعریفوي چې په خورا اقتصادي ارزښتناکه کار کې انسانان غوره کوي." د ګوګل ډیپ مینډ پوهه د دې دوه تعریفونو څخه یو څه توپیر لري؛ لابراتوار AGI ته د AI په توګه ګوري چې لږترلږه په ډیرو ادراکي کارونو کې د انسانانو په څیر وړتیا لري. مغشوش؟ اندیښنه مه کوئ - نو د AI څیړنې په سر کې ماهرین دي.

مصنوعي عمومي استخبارات، یا AGI، یو ناپاک اصطلاح ده. مګر دا عموما AI ته اشاره کوي چې په ډیری کې د اوسط انسان په پرتله ډیر وړتیا لري، که ډیری نه وي، دندې. د OpenAI CEO سیم الټمن یوځل AGI د "میډین انسان سره مساوي په توګه تشریح کړ چې تاسو کولی شئ د همکار په توګه وګمارل شي." په ورته وخت کې، د OpenAI منشور AGI د "خورا خپلواکه سیسټمونو په توګه تعریفوي چې په خورا اقتصادي ارزښتناکه کار کې انسانان غوره کوي." د ګوګل ډیپ مینډ پوهه د دې دوه تعریفونو څخه یو څه توپیر لري؛ لابراتوار AGI ته د AI په توګه ګوري چې لږترلږه په ډیرو ادراکي کارونو کې د انسانانو په څیر وړتیا لري. مغشوش؟ اندیښنه مه کوئ - نو د AI څیړنې په سر کې ماهرین دي.

د AI اجنټ هغه وسیلې ته اشاره کوي چې ستاسو په استازیتوب د یو لړ دندو ترسره کولو لپاره د AI ټیکنالوژۍ کاروي - د هغه څه څخه هاخوا چې د AI چیټبوټ ډیر لومړني ترسره کولی شي - لکه د لګښتونو ډکول ، د ټکټونو بک کول یا په رستورانت کې میز ، یا حتی د کوډ لیکل او ساتل. په هرصورت ، لکه څنګه چې موږ دمخه تشریح کړی ، پدې بیړني ځای کې ډیری خوځنده ټوټې شتون لري ، نو د "AI اجنټ" ممکن مختلف خلکو ته مختلف شیان معنی ولري. زیربنا هم لاهم د دې اټکل شوي ظرفیتونو د وړاندې کولو لپاره رامینځته کیږي. مګر بنسټیز مفهوم یو خودمختاره سیسټم معنی لري چې کیدای شي د څو مرحلو دندو ترسره کولو لپاره ډیری AI سیسټمونه راوباسي.

د سافټویر د یوې برخې شاته د "تڼۍ" په توګه د API پای ټکي په اړه فکر وکړئ چې نور برنامې کولی شي فشار راوړي ترڅو دا شیان ترسره کړي. پراختیا کونکي دا انٹرفیسونه د ادغام رامینځته کولو لپاره کاروي - د مثال په توګه ، یو غوښتنلیک ته اجازه ورکول چې له بل څخه ډیټا راوباسي ، یا د AI اجنټ وړ کړي چې د دریمې ډلې خدمات په مستقیم ډول کنټرول کړي پرته لدې چې انسان په لاسي ډول هر انٹرفیس چلوي. ډیری سمارټ کور وسیلې او وصل شوي پلیټ فارمونه دا پټ بټنونه شتون لري ، حتی که عادي کارونکي هیڅکله له دوی سره نه ګوري یا متقابل عمل کوي. لکه څنګه چې د AI اجنټان ډیر وړتیا وده کوي، دوی په زیاتیدونکي توګه د دې توان لري چې دا پای ټکي پخپله ومومي او وکاروي، د اتومات کولو لپاره پیاوړي - او ځینې وختونه غیر متوقع - امکانات پرانیزي.

د یوې ساده پوښتنې په پام کې نیولو سره، د انسان دماغ کولی شي پرته له دې چې ډیر فکر وکړي ځواب ورکړي - شیان لکه "کوم حیوان لوړ دی، زرافه یا پیشو؟" مګر په ډیری قضیو کې، تاسو ډیری وختونه قلم او کاغذ ته اړتیا لرئ ترڅو د سم ځواب سره راشي ځکه چې منځګړیتوب ګامونه شتون لري. د مثال په توګه، که چیرې یو بزګر چرګان او غواګانې ولري، او یوځای یې 40 سرونه او 120 پښې ولري، تاسو ممکن د ځواب سره د رسیدلو لپاره یو ساده معادل لیکلو ته اړتیا ولرئ (20 چرګان او 20 غواګانې).

د AI په شرایطو کې، د لوی ژبې ماډلونو لپاره د فکر کولو سلسله پدې معنی ده چې ستونزه په کوچنیو، منځنیو ګامونو کې ماتول د پای پایلې کیفیت ښه کولو لپاره. دا معمولا د ځواب ترلاسه کولو لپاره ډیر وخت نیسي، مګر ځواب ډیر احتمال لري چې سم وي، په ځانګړې توګه د منطق یا کوډ کولو شرایطو کې. د استدلال ماډلونه د دودیزو لویو ژبو ماډلونو څخه رامینځته شوي او د تقویت زده کړې څخه مننه د سلسلې فکر کولو فکر لپاره غوره شوي.

(وګورئ: د ژبې لوی ماډل)

دا یو ډیر مشخص مفهوم دی چې د "AI اجنټ" معنی لري چې یو برنامه ده چې کولی شي پخپله ګام په ګام ګام پورته کړي ترڅو هدف بشپړ کړي. د کوډ کولو اجنټ یوه ځانګړې نسخه ده چې د سافټویر پراختیا لپاره پلي کیږي. د دې پرځای چې انسان ته د بیاکتنې او پیسټ کولو لپاره په ساده ډول د کوډ وړاندیز وکړي ، د کوډ کولو اجنټ کولی شي په خپلواکه توګه کوډ ولیکي ، ازموینه وکړي او ډیبګ وکړي ، د تکراري ، محاکمې او خطا کار ډول اداره کوي چې معمولا د پراختیا کونکي ورځ مصرفوي. دا اجنټان کولی شي په ټول کوډبیسونو کې کار وکړي، د کیګونو نښه کول، د ازموینې چلولو، او د لږ تر لږه بشري نظارت سره د اصلاحاتو فشار راوستل. د دې په اړه فکر وکړئ لکه یو خورا ګړندی انٹرن ګمارل چې هیڅکله خوب نه کوي او هیڅکله تمرکز له لاسه نه ورکوي - که څه هم ، لکه څنګه چې د کوم انٹرن سره ، یو انسان لاهم اړتیا لري د کار بیاکتنه وکړي. که څه هم یو څه څو اړخیزه اصطالح، محاسبه عموما حیاتي کمپیوټري ځواک ته اشاره کوي چې د AI ماډلونو ته اجازه ورکوي چې کار وکړي. دا ډول پروسس د AI صنعت ته سونګ ورکوي، دا د دې توان ورکوي چې خپل پیاوړي ماډلونه روزي او ځای په ځای کړي. اصطلاح اکثرا د هارډویر ډولونو لپاره لنډیز دی چې کمپیوټري ځواک چمتو کوي - شیان لکه GPUs، CPUs، TPUs، او د زیربنا نور ډولونه چې د عصري AI صنعت بنسټ جوړوي.

د ځان د ښه کولو ماشین زده کړې یوه فرعي سیټ چې په کې د AI الګوریتمونه د څو پوړونو، مصنوعي عصبي شبکې (ANN) جوړښت سره ډیزاین شوي. دا دوی ته اجازه ورکوي چې د ساده ماشین زده کړې پراساس سیسټمونو په پرتله خورا پیچلې اړیکې رامینځته کړي ، لکه خطي ماډلونه یا د پریکړې ونې. د ژورې زده کړې الګوریتم جوړښت د انسان په مغز کې د نیورونونو له یو بل سره تړلي لارو څخه الهام اخلي.

د ژورې زده کړې AI ماډلونه د دې وړتیا لري چې پخپله ډیټا کې مهم ځانګړتیاوې وپیژني، د دې پر ځای چې انساني انجنیرانو ته اړتیا ولري چې دا ځانګړتیاوې تعریف کړي. جوړښت د الګوریتمونو ملاتړ هم کوي چې کولی شي له غلطیو زده کړي او د تکرار او تنظیم کولو پروسې له لارې خپل محصول ښه کړي. په هرصورت، د ژورې زده کړې سیسټمونه د ډیرو معلوماتو پوائنټونو ته اړتیا لري ترڅو ښې پایلې ترلاسه کړي (میلیون یا ډیر). دوی معمولا د ساده ماشین زده کړې الګوریتمونو په پرتله روزنې ته ډیر وخت نیسي - نو د پراختیا لګښتونه لوړ دي.

(وګورئ: عصبي شبکه)

ډیفیوژن د ډیری هنر ، میوزیک- او متن تولید کونکي AI ماډلونو په زړه کې ټیک دی. د فزیک څخه الهام اخیستل شوي، د خپریدو سیسټمونه ورو ورو د ډیټا جوړښت "له منځه وړي" - د بیلګې په توګه، عکسونه، سندرې، او داسې نور - د شور په اضافه کولو سره تر هغه چې هیڅ شی پاتې نه وي. په فزیک کې، خپریدل ناڅاپي او نه بدلیدونکي دي - په قهوه کې توزیع شوي بوره د مکعب شکل ته نشي راوستل کیدی. مګر په AI کې د خپریدو سیسټمونه هدف لري چې د ویجاړ شوي ډیټا بیرته راګرځولو لپاره یو ډول "ریورس ډیفیوژن" پروسې زده کړي ، د شور څخه ډیټا بیرته ترلاسه کولو وړتیا ترلاسه کوي.

استخراج یو تخنیک دی چې د "ښوونکي - زده کونکي" ماډل سره د لوی AI ماډل څخه د پوهې استخراج لپاره کارول کیږي. پراختیا کونکي د ښوونکي ماډل ته غوښتنې لیږي او پایلې یې ثبتوي. ځوابونه کله ناکله د ډیټا سیټ سره پرتله کیږي ترڅو وګوري چې دوی څومره دقیق دي. دا پایلې بیا د زده کونکي ماډل روزلو لپاره کارول کیږي، کوم چې د ښوونکي چلند اټکل کولو لپاره روزل کیږي.

ډیسټیلیشن د لوی ماډل پراساس د کوچني ، ډیر موثر ماډل رامینځته کولو لپاره کارول کیدی شي چې لږترلږه د استخراج ضایع کیدو سره. دا احتمال لري چې څنګه OpenAI GPT-4 ټربو ته وده ورکړي، د GPT-4 چټکه نسخه.

پداسې حال کې چې د AI ټول شرکتونه په داخلي توګه استخراج کاروي، دا ممکن د ځینو AI شرکتونو لخوا د فرنټیر ماډلونو سره د نیولو لپاره هم کارول شوي وي. د سیالي کونکي څخه مینځل معمولا د AI API او چیټ معاونینو د خدماتو شرایط سرغړونه کوي.

دا د AI ماډل نور روزنې ته اشاره کوي ترڅو د ډیر ځانګړي دندې یا ساحې لپاره فعالیت غوره کړي په پرتله چې دمخه یې د دې روزنې مرکزي نقطه وه - په ځانګړي توګه د نوي ، تخصصي (د بیلګې په توګه ، د دندې پر بنسټ) معلوماتو کې تغذیه کولو سره.

د AI ډیری پیل کونکي د سوداګریز محصول رامینځته کولو لپاره د پیل ټکي په توګه د ژبې لوی ماډلونه اخلي مګر د خپل ځانګړي ډومین - ځانګړي پوهې او تخصص پراساس د ښه ټیوننګ سره د مخکیني روزنې دورې بشپړولو سره د هدف سکتور یا دندې لپاره د افادیت لوړولو په لټه کې دي.

(وګورئ: د ژبې لوی ماډل [LLM])

A GAN، یا جنریټیو مخالفه شبکه، د ماشین زده کړې یو ډول چوکاټ دی چې په تولیدي AI کې ځینې مهم پرمختګونه په ګوته کوي کله چې د ریښتیني ډیټا تولید کولو خبره راځي - پشمول (مګر نه یوازې) ژور جعلي اوزار. GANs د عصبي شبکو د یوې جوړې کارول شامل دي، چې یو یې د دې روزنې ډیټا راوباسي ترڅو محصول تولید کړي چې د ارزونې لپاره بل ماډل ته لیږدول کیږي.

دوه ماډلونه په اصل کې برنامه شوي ترڅو د یو بل څخه د وتلو هڅه وکړي. جنراتور هڅه کوي خپل محصول د امتیاز کونکي څخه تیر کړي، پداسې حال کې چې امتیاز کوونکی په مصنوعي ډول تولید شوي ډاټا موندلو لپاره کار کوي. دا جوړ شوی سیالي کولی شي د اضافي انساني مداخلې اړتیا پرته د AI محصولات ډیر ریښتیني وي. که څه هم GANs د عمومي هدف AI پرځای د محدود غوښتنلیکونو (لکه د حقیقي عکسونو یا ویډیوګانو تولید) لپاره غوره کار کوي.

هیلوسینیشن د AI موډلونو لپاره د AI صنعت غوره اصطالح ده چې توکي جوړوي - په حقیقت کې د معلوماتو تولید کول چې غلط دي. په ښکاره ډول، دا د AI کیفیت لپاره لویه ستونزه ده. هیلوسینشن د GenAI پایلې تولیدوي چې ګمراه کوونکی وي او حتی د ریښتیني ژوند خطرونو لامل کیدی شي - د احتمالي خطرناکو پایلو سره (د روغتیا پوښتنې په اړه فکر وکړئ چې زیان رسونکي طبي مشورې بیرته راوړي).

د AIs د معلوماتو د جوړولو ستونزه فکر کیږي چې د روزنې معلوماتو کې د تشو په پایله کې رامینځته کیږي. هیلوسینیشنونه د مخ په زیاتیدونکي تخصصي او/یا عمودی AI ماډلونو په لور هڅولو کې مرسته کوي - د بیلګې په توګه د ډومین ځانګړي AIs چې لږ تخصص ته اړتیا لري - د یوې لارې په توګه د پوهې د تشو احتمال کم کړي او د غلط معلوماتو خطرونه کم کړي.

انفرنس د AI ماډل چلولو پروسه ده. دا د وړاندوینې کولو یا د مخکینیو لیدل شویو معلوماتو څخه د پایلو راټولولو لپاره یو ماډل خلاص تنظیموي. د روښانه کیدو لپاره، د روزنې پرته اټکل نشي کیدی؛ یو ماډل باید د ډیټا په سیټ کې نمونې زده کړي مخکې لدې چې دا د دې روزنې ډیټا څخه په مؤثره توګه استخراج شي.

د هارډویر ډیری ډولونه کولی شي انګیزه ترسره کړي، د سمارټ فون پروسس کونکو څخه د غوښې GPUs څخه د دودیز ډیزاین شوي AI سرعت کونکي پورې. مګر دا ټول نشي کولی ماډلونه په مساوي ډول پرمخ بوځي. خورا لوی ماډلونه به د لوړ پای AI چپس سره د کلاوډ سرور په مقابل کې لپ ټاپ په اړه وړاندوینې کولو لپاره عمرونه وخت ونیسي.

[وګورئ: روزنه ]

د ژبې لوی ماډلونه، یا LLMs، د AI ماډلونه دي چې د مشهور AI معاونینو لخوا کارول کیږي، لکه ChatGPT، Claude، د ګوګل جیمني، Meta's AI Llama، Microsoft Copilot، یا Mistral's Le Chat. کله چې تاسو د AI معاون سره خبرې کوئ، تاسو د لوی ژبې ماډل سره اړیکه ونیسئ چې ستاسو غوښتنه په مستقیم ډول یا د مختلفو موجودو وسیلو په مرسته پروسس کوي، لکه د ویب لټون کول یا د کوډ ژباړونکي.

LLMs ژور عصبي شبکې دي چې د ملیاردونو عددي پیرامیټونو (یا وزنونه ، لاندې وګورئ) څخه جوړ شوي دي چې د کلمو او جملو ترمینځ اړیکې زده کوي او د ژبې نمایش رامینځته کوي ، د کلمو یو ډول څو اړخیزه نقشه.

دا ماډلونه د هغه نمونو کوډ کولو څخه رامینځته شوي چې دوی په ملیاردونو کتابونو ، مقالو او لیکونو کې موندلي. کله چې تاسو LLM ته اشاره وکړئ، ماډل خورا احتمالي نمونه رامینځته کوي چې د پرامپټ سره سمون لري.

(وګورئ: عصبي شبکه)

د حافظې زیرمه یو مهم پروسې ته اشاره کوي چې انفرنس ته وده ورکوي (کوم هغه پروسه ده چې AI د کارونکي پوښتنې ته د ځواب رامینځته کولو لپاره کار کوي). په اصل کې، کیشینګ د اصلاح کولو تخنیک دی، چې د اټکل ډیر اغیزمن کولو لپاره ډیزاین شوی. AI په ښکاره ډول د لوړ اوکټین ریاضیاتو محاسبې لخوا پرمخ وړل کیږي او هرکله چې دا محاسبې ترسره کیږي ، دوی ډیر ځواک کاروي. کیشینګ د دې لپاره ډیزاین شوی چې د محاسبې شمیر کم کړي چې یو ماډل ممکن د راتلونکي کارونکي پوښتنو او عملیاتو لپاره ځانګړي محاسبې خوندي کولو سره پرمخ بوځي. د حافظې کیشینګ مختلف ډولونه شتون لري ، که څه هم یو له خورا مشهور کیچ KV (یا کلیدي ارزښت) کیشینګ دی. د KV کیشینګ د ټرانسفارمر پر بنسټ ماډلونو کې کار کوي، او موثریت زیاتوي، د کارونکي پوښتنو ته د ځوابونو پیدا کولو لپاره د وخت (او الګوریتمیک کار) په کمولو سره چټکې پایلې وړاندې کوي.

(وګورئ: قیاس)

یو عصبي شبکه د څو پوړونو الګوریتمیک جوړښت ته اشاره کوي چې ژورې زده کړې ته وده ورکوي - او په پراخه کچه د لوی ژبې ماډلونو رامینځته کیدو وروسته د تولیدي AI وسیلو کې بشپړ بوم.

که څه هم د ډیټا پروسس کولو الګوریتمونو لپاره د ډیزاین جوړښت په توګه د انسان مغز له کثافاتو سره وصل شوي لارو څخه د الهام اخیستو مفکوره د 1940 لسیزې پورې نیټه ده ، دا د ګرافیکي پروسس کولو هارډویر (GPUs) خورا وروستي وده وه - د ویډیو لوبې صنعت له لارې - چې واقعیا د دې تیوري ځواک خلاص کړ. دا چپس په تیرو وختونو کې د امکان په پرتله د ډیری نورو پرتونو سره د الګوریتمونو روزنې لپاره مناسب ثابت شوي - د عصبي شبکې پراساس AI سیسټمونو ته وړتیا ورکوي ترڅو په ډیری ډومینونو کې خورا ښه فعالیت ترلاسه کړي ، پشمول د غږ پیژندنه ، خپلواکه نیویګیشن ، او د مخدره توکو کشف.

(وګورئ: د ژبې لوی ماډل [LLM])

خلاصې سرچینې سافټویر ته اشاره کوي - یا په زیاتیدونکي توګه د AI ماډلونه - چیرې چې اصلي کوډ په عامه توګه د هرچا لپاره د کارولو، معاینې یا ترمیم لپاره چمتو شوی. د AI نړۍ کې، د میټا لاما د ماډلونو کورنۍ یو مهم مثال دی؛ لینکس په عملیاتي سیسټمونو کې مشهور تاریخي موازي دی. د خلاصې سرچینې تګلارې په ټوله نړۍ کې څیړونکو، پراختیا کونکو او شرکتونو ته اجازه ورکوي چې د یو بل کار په سر کې رامینځته کړي، پرمختګ ګړندی کړي او د خپلواک خوندیتوب پلټنې وړ کړي چې تړل شوي سیسټمونه په اسانۍ سره نشي چمتو کولی. تړل شوې سرچینه پدې معنی ده چې کوډ خصوصي دی - تاسو کولی شئ محصول وکاروئ مګر نه ګورئ چې دا څنګه کار کوي ، لکه څنګه چې د OpenAI GPT ماډلونو سره قضیه ده - یو توپیر چې د AI صنعت کې یو له تعریف شوي بحثونو څخه ګرځیدلی. موازي کول پدې معنی دي چې د یو وروسته بل پرځای په ورته وخت کې ډیری شیان ترسره کول - لکه د 10 کارمندانو درلودل چې په ورته وخت کې د پروژې په بیلابیلو برخو کې کار کوي د دې پرځای چې یو کارمند هرڅه په ترتیب سره ترسره کړي. په AI کې، موازي کول د روزنې او انعطاف دواړو لپاره بنسټیز دي: عصري GPUs په ځانګړي ډول ډیزاین شوي ترڅو په موازي توګه زرګونه محاسبې ترسره کړي، کوم چې یو لوی دلیل دی چې ولې دوی د صنعت هارډویر ریښه شوي. لکه څنګه چې د AI سیسټمونه خورا پیچلي وده کوي او ماډلونه لوی کیږي ، د ډیری چپسونو او ډیری ماشینونو په اوږدو کې د کار موازي کولو وړتیا د دې معلومولو کې یو له خورا مهم فاکتورونو څخه ګرځیدلی چې څومره ګړندي او ارزانه ماډلونه رامینځته کیدی شي او ځای په ځای شي. د موازي کولو غوره ستراتیژیو څیړنه اوس په خپل حق کې د مطالعې ساحه ده.

RAMageddon په زړه پورې نوې اصطالح ده چې د نه ساتیري رجحان لپاره چې د ټیکنالوژۍ صنعت پراخه کوي: د تصادفي لاسرسي حافظې په دوامداره توګه مخ په زیاتیدونکي کمښت، یا د RAM چپس، کوم چې د ټولو تخنیکي محصولاتو ځواک لري چې موږ یې په ورځني ژوند کې کاروو. لکه څنګه چې د AI صنعت وده کړې ، د ټیکنالوژۍ لوی شرکتونه او د AI لابراتوارونه - ټول د خورا پیاوړي او موثر AI درلودلو په لټه کې دي - د دوی ډیټا مرکزونو ځواک کولو لپاره دومره RAM اخلي چې زموږ د پاتې نورو لپاره ډیر څه پاتې ندي. او دا د اکمالاتو خنډ پدې معنی دی چې هغه څه چې پاتې دي ډیر او ګران کیږي.

پدې کې د لوبو په څیر صنعتونه شامل دي (چیرې چې لوی شرکتونه باید په کنسولونو کې نرخونه لوړ کړي ځکه چې د دوی وسیلو لپاره د حافظې چپس موندل ګران دي) ، د مصرف کونکي بریښنایی توکي (چیرې چې د حافظې کمښت ممکن د یوې لسیزې څخه ډیر وخت کې د سمارټ فون لیږد کې ترټولو لوی ډوب لامل شي) ، او عمومي تصدۍ کمپیوټري (ځکه چې دا شرکتونه نشي کولی د خپلو ډیټا مرکزونو لپاره کافي رام ترلاسه کړي). په نرخونو کې زیاتوالی یوازې تمه کیږي چې د ویره لرونکي کمښت پای ته رسیدو وروسته ودریږي مګر له بده مرغه ، واقعیا دومره نښه شتون نلري چې هر وخت به پیښ شي.

د AGI په څیر، تکراري ځان ښه کول د دې لپاره یو حد دی چې څنګه سمارټ AI ترلاسه کولی شي، او دا څومره لږ په انسانانو تکیه کولی شي. د RSI سناریو کې، د AI ماډلونه د انساني مداخلې پرته خپل ځان ته وده ورکوي، د وړتیاوو او خودمختاری لوی سرعت لامل کیږي. په ځینو ویناوو کې، دا به یو ناورین شیبه وي چې د واحدیت سره ورته وي، یوه شیبه کله چې د AI ماډلونه د بهر مداخلې لپاره معافیت لري. مګر RSI یو اساسي وړتیا هم بیانوي - ایا د AI ماډل کولی شي خپل ځای ناستی ډیزاین کړي؟ - کوم چې د انجنیرانو لپاره دا خورا اسانه کوي چې د جوړولو هڅه وکړي. د AI یو شمیر وروستي پیلونه په تکراري ډول د ځان ښه کولو ماډلونو رامینځته کولو لپاره چمتو شوي ، مګر ډیری یې د apocalyptic اغیزې ردوي ، RSI د څیړنې لپاره د راتلونکي سرحد په توګه وړاندې کوي.

د تقویت زده کړه د AI روزنې یوه لاره ده چیرې چې یو سیسټم د شیانو په هڅه کولو او د سم ځوابونو لپاره جایزې ترلاسه کولو سره زده کوي - لکه ستاسو د ګران څارویو روزنه د درملنې سره ، پرته لدې چې پدې سناریو کې "پالنه" یو عصبي شبکه ده او "علاج" یو ریاضیاتی سیګنال دی چې بریالیتوب ښیې. د څارل شوي زده کړې برعکس، چیرې چې یو ماډل د لیبل شوي مثالونو په ثابت ډیټاسیټ کې روزل کیږي، د پیاوړتیا زده کړه موډل ته اجازه ورکوي چې خپل چاپیریال وپلټي، عمل وکړي، او په دوامداره توګه خپل چلند د هغه فیډبیک پراساس چې ترلاسه کوي تازه کړي. دا طریقه په ځانګړې توګه د AI روزنې لپاره د لوبو لوبولو، کنټرول روبوټونو، او په دې وروستیو کې د لوی ژبې ماډلونو د استدلال وړتیا ګړندۍ کولو لپاره خورا پیاوړی ثابت شوی. د انساني فیډبیک یا RLHF څخه د تقویت زده کړې په څیر تخنیکونه اوس مرکزي دي چې څنګه د AI مخکښ لابراتوارونه خپل ماډلونه ښه تنظیموي ترڅو ډیر ګټور ، دقیق او خوندي وي.

کله چې دا د انسان - ماشین اړیکو ته راځي، ځینې ښکاره ننګونې شتون لري - خلک د انساني ژبې په کارولو سره اړیکه نیسي، پداسې حال کې چې د AI پروګرامونه د پیچلو الګوریتمیک پروسو له الرې دندې ترسره کوي چې د معلوماتو لخوا خبر شوي. ټوکن دا تشه ډکوي: دا د انسان - AI مخابراتو بنسټیز ودانۍ بلاکونه دي، د ډیټا جلا برخې استازیتوب کوي چې د LLM لخوا پروسس شوي یا تولید شوي. دوی د یوې پروسې له لارې رامینځته شوي چې د ټوکنائزیشن په نوم یادیږي ، کوم چې خام متن د بټ اندازې واحدونو کې ماتوي چې د ژبې ماډل کولی شي هضم کړي ، ورته ورته چې څنګه یو کمپیلر د انسان ژبه بائنری کوډ ته ژباړي چې کمپیوټر کولی شي پوه شي. د تصدۍ په ترتیباتو کې، ټوکن هم لګښت ټاکي - ډیری AI شرکتونه د LLM کارولو لپاره د هر ټکن په اساس چارج کوي، پدې معنی چې څومره چې سوداګرۍ کاروي، هومره یې پیسې ورکوي. نو بیا، ټوکن د متن کوچنۍ برخې دي - ډیری وختونه د بشپړو پرځای د کلمو برخې - چې د AI ژبې ماډلونه د پروسس کولو دمخه ژبه ماتوي؛ دوی د AI کاري بارونو د پوهیدو لپاره د "کلمو" سره نږدې ورته دي. Throughput دې ته اشاره کوي چې په یوه ټاکل شوې موده کې څومره پروسس کیدی شي، نو د نښه کولو وسیله په اصل کې یو اندازه ده چې څومره AI کار کولی شي یو سیسټم په یو وخت کې اداره کړي. د AI زیربنا ټیمونو لپاره د لوړې نښه کولو وسیله کلیدي هدف دی ، ځکه چې دا مشخص کوي چې څومره کارونکي کولی شي په ورته وخت کې خدمت وکړي او څومره ژر چې هر یو یې ځواب ترلاسه کوي. د AI څیړونکي اندریج کارپاتي د اضطراب احساس بیان کړی کله چې د هغه د AI ګډونونه بې کاره وي - د هغه احساس څرګندونه چې هغه د یو فارغ زده کونکي په توګه درلوده کله چې د کمپیوټر ګران هارډویر په بشپړ ډول نه کارول کیده - یو احساس چې دا په ګوته کوي چې ولې د ټوکن له لارې اعظمي کول په ساحه کې یو جنون ګرځیدلی.

د ماشین زده کړې AIs رامینځته کول یوه پروسه شامله ده چې د روزنې په نوم پیژندل کیږي. په ساده اصطلاحاتو کې، دا د معلوماتو تغذیه کولو ته اشاره کوي ترڅو ماډل کولی شي له نمونو څخه زده کړي او ګټورې پایلې تولید کړي. په اصل کې، دا د سیسټم پروسه ده چې په ډاټا کې ځانګړتیاوو ته ځواب ووايي چې دا د دې توان ورکوي چې د غوښتل شوي هدف په لور محصولات تطبیق کړي - که دا د پیشوګانو انځورونه وپیژني یا د غوښتنې سره سم هایکو تولید کړي.

روزنه ګرانه کیدی شي ځکه چې دا ډیرو معلوماتو ته اړتیا لري، او د اړتیا وړ حجمونه پورته خوا ته روان دي - له همدې امله د هایبرډ طریقې، لکه د هدف شوي ډیټا سره د قواعدو پر بنسټ AI ښه کول، کولی شي د لګښتونو اداره کولو کې مرسته وکړي پرته له دې چې په بشپړه توګه له پیل څخه پیل شي.

[وګورئ: استدلال]

یو تخنیک چیرې چې دمخه روزل شوی AI ماډل د مختلف مګر معمولا اړوند دندې لپاره د نوي ماډل رامینځته کولو لپاره د پیل ټکي په توګه کارول کیږي - اجازه ورکوي چې پوهه په تیرو روزنیزو دورو کې ترلاسه کړي بیا پلي شي.

د لیږد زده کړه کولی شي د موډل پراختیا شارټ کټ کولو سره د موثریت سپما وکړي. دا هم ګټور کیدی شي کله چې د دندې لپاره ډیټا چې ماډل یې رامینځته کیږي یو څه محدود وي. مګر دا مهمه ده چې یادونه وکړو چې چلند محدودیتونه لري. هغه موډلونه چې د عمومي وړتیاوو ترلاسه کولو لپاره د لیږد زده کړې باندې تکیه کوي احتمال به د دوی د تمرکز په ساحه کې د ښه ترسره کولو لپاره د اضافي معلوماتو روزنې ته اړتیا ولري.

(وګورئ: ښه سمون)

د اعتبار ضایع یوه شمیره ده چې تاسو ته درکوي چې د AI ماډل د روزنې پرمهال څومره ښه زده کوي - او ټیټ یې غوره دی. څیړونکي دا د ریښتیني وخت راپور کارت په توګه نږدې تعقیبوي ، د دې په کارولو سره پریکړه کوي چې کله روزنه ودروي ، کله د هایپرپرامیټرونو تنظیم کول ، یا د احتمالي ستونزې څیړنه وکړي. یو له مهمو اندیښنو څخه چې دا د بیرغ سره مرسته کوي ډیر مناسب دی، یو داسې حالت چې په هغه کې یو ماډل د ریښتینې زده کړې نمونو پرځای خپل د روزنې ډاټا حفظ کوي دا کولی شي نوي حالتونو ته عمومي کړي. د هغه زده کونکي تر مینځ د توپیر په توګه فکر وکړئ څوک چې په ریښتیني ډول په موادو پوهیږي او هغه څوک چې په ساده ډول یې د تیر کال ازموینه حفظ کړې - د اعتبار له لاسه ورکولو سره مرسته کوي په ګوته کړي چې ستاسو کوم ماډل رامینځته کیږي.

وزنونه د AI روزنې لپاره اصلي دي، ځکه چې دوی مشخص کوي چې څومره اهمیت (یا وزن) د سیسټم روزنې لپاره کارول شوي ډیټا کې مختلف ځانګړتیاو (یا ان پټ متغیرونو) ته ورکول کیږي - په دې توګه د AI ماډل محصول ته بڼه ورکوي.

په بله لاره واچوئ، وزنونه عددي پیرامیټونه دي چې د ورکړل شوي روزنې دندې لپاره په ډیټاسیټ کې خورا مهم څه تعریفوي. دوی خپل فعالیت ته د ضرب پلي کولو له لارې ترلاسه کوي. د ماډل روزنه معمولا د وزنونو سره پیل کیږي چې په تصادفي ډول ټاکل شوي وي، مګر لکه څنګه چې پروسه راڅرګندیږي، وزنونه تعدیل کیږي ځکه چې ماډل هڅه کوي داسې محصول ته ورسیږي چې د هدف سره ډیر نږدې وي.

د مثال په توګه، د هستوګنې د قیمتونو وړاندوینې لپاره د AI ماډل چې د هدف ځای لپاره د تاریخي املاکو ډیټا په اړه روزل شوي د ځانګړتیاو وزنونه لکه د خوب خونو او تشنابونو شمیر ، ایا ملکیت جلا یا نیمه جلا دی ، ایا دا پارکینګ لري ، ګراج او داسې نور.

په نهایت کې، هغه وزنونه چې ماډل د دې هر یو سره ضمیمه کوي دا منعکس کوي چې دوی د ورکړل شوي ډیټاسیټ پراساس د ملکیت ارزښت څومره اغیزه کوي.

دا مقاله په منظم ډول د نوي معلوماتو سره تازه کیږي.