جیسا کہ LLMs زیادہ طاقتور ہو گئے ہیں، فریب نظروں سے بچنا سخت مشکل ثابت ہوا ہے۔ یہاں تک کہ ہوشیار ترین ماڈلز میں بھی غلطیاں ظاہر ہوتی ہیں، اور جب کہ ان غلطیوں کو پکڑنے کے طریقے موجود ہیں، صنعت اب بھی اسے کرنے کا بہترین طریقہ تلاش کر رہی ہے۔ ممکنہ طور پر، جس نے ابھی اینڈریسن ہورووٹز سے بیجوں کی فنڈنگ میں $9 ملین اکٹھا کیا ہے، ان غلطیوں کو پکڑنے کے لیے مزید سخت طریقہ بنانے کی کوشش کر رہا ہے۔

ممکنہ طور پر، جس نے ابھی اینڈریسن ہورووٹز سے بیجوں کی فنڈنگ میں $9 ملین اکٹھا کیا ہے، ان غلطیوں کو پکڑنے کے لیے مزید سخت طریقہ بنانے کی کوشش کر رہا ہے۔

جیسا کہ بانی پیٹر الیاس (اوپر کی تصویر میں) بتاتے ہیں، کمپنی کا مقصد فریب اور سادہ حقائق کی غلطیوں کو صارف تک پہنچنے سے روکنا ہے، اور اس قسم کی 99.99% درستگی حاصل کرنا ہے جو کہ تعییناتی نظاموں میں عام ہے لیکن AI کے ساتھ پہنچنا اس سے کہیں زیادہ مشکل ہے۔ جیسا کہ یہ پتہ چلتا ہے، LLMs کو درستگی کی اس سطح پر لانے کے لیے AI انجینئرنگ کے بہت سے بنیادی مفروضوں پر دوبارہ غور کرنے کی ضرورت ہے۔

شاید کا پہلا پروڈکٹ ڈیٹا سائنس ٹول ہے، جو پیچیدہ ڈیٹاسیٹس سے فوری جوابات تیار کرنے کے لیے بنایا گیا ہے۔ ہر نتیجہ ایک اقتباس اور ایک آڈٹ ٹریل کے ساتھ آتا ہے کہ اسے کیسے تیار کیا گیا، AI ٹولز میں تیزی سے عام رواج۔

لیکن غلطیوں کو ان خلاصوں میں گھسنے سے روکنے کے لیے ایک وسیع کنٹرول سسٹم کی ضرورت تھی جسے الیاس "ڈیٹا سائنس میک سوٹ" کے طور پر بیان کرتا ہے۔ LLM کے فرسٹ پاس جوابات کی جانچ ایک تعییناتی توثیق کرنے والے نظام کے خلاف کی جاتی ہے، جو ڈیٹا سیٹ سے مماثل نہ ہونے والے کسی بھی نتائج کو واپس لے لیتا ہے۔ کمپنی نے کہا کہ اہم طور پر، ایل ایل ایم کو توثیق کرنے والے کے خلاف تربیت دی گئی ہے، اور پورا نظام تیز اور درست جوابات کے لیے موزوں ہے۔

الیاس کہتے ہیں، "ہم نے اس کی تعمیر میں جو سیکھا وہ یہ تھا کہ آپ کی ہارنس انجینئرنگ جتنی بہتر ہوگی، ماڈل اتنا ہی کمزور ہو سکتا ہے،" الیاس کہتے ہیں۔ "اگر آپ سیاق و سباق کو کافی حد تک بہتر کر سکتے ہیں، تو ماڈل کو صحیح کام کرنے کے لیے بہت زیادہ محنت کرنے کی ضرورت نہیں ہے۔ بنیادی طور پر، یہ ابہام کو کم کرنے کی مشق ہے۔"

یہ شاید کے ڈیٹا سائنس ٹول کو نمایاں طور پر چھوٹے AI ماڈلز پر چلانے کی اجازت دیتا ہے۔ الیاس کا کہنا ہے کہ موجودہ ورژن ایک ایسے ماڈل پر چل رہا ہے جو "فرنٹیئر ماڈلز کے مقابلے میں چار کلاسز کمزور" ہے، جس کا مطلب ہے کہ اسے مقامی ہارڈ ویئر (یعنی ڈیٹا سینٹر کی بجائے ڈیسک ٹاپ کمپیوٹر) پر چلایا جا سکتا ہے، جس سے AI کے استعمال سے وابستہ ٹوکن کے اخراجات کی ایک بڑی رقم کم ہو جاتی ہے۔

یہ ایک ایسے وقت میں ایک خوش آئند خیال ہے جب ٹوکن کی قیمتیں بڑھ رہی ہیں اور بہت سے صارفین اپنے AI بجٹ کا دوبارہ جائزہ لے رہے ہیں۔ اور، الیاس کا خیال ڈیٹا سائنس کے ساتھ ختم نہیں ہوتا، کیونکہ اسی انجن کو اکاؤنٹنگ یا طبی خدمات جیسے استعمال کے معاملات کا احاطہ کرنے کے لیے بڑھایا جا سکتا ہے - جیسا کہ الیاس کہتے ہیں، "کوئی بھی درست استعمال کا معاملہ۔"

"میرے خیال میں یہ واقعی دلچسپ ہے کہ بڑی اے آئی لیبز نے بھی ایسا کرنے کی کوشش نہیں کی،" الیاس کہتے ہیں۔ "انہیں ایسا نہ کرنے کی ترغیب دی جاتی ہے، کیونکہ وہ جتنی بار آپ کو ماڈل کو درست کرنا پڑتا ہے اتنا ہی زیادہ پیسہ کماتے ہیں۔"

ممکنہ طور پر زیادہ قابل اعتماد قسم کی AI بنانے کے لیے $9M اکٹھا کرتا ہے۔

متعلقہ خبریں

گوگل نے 4x تیز ٹیکسٹ جنریشن کے ساتھ لائٹننگ فاسٹ اوپن سورس AI ماڈل جاری کیا - صارفین کے GPUs پر چلتا ہے۔

ڈیپ سیک نئے AI ماڈل کا پیش نظارہ کرتا ہے جو فرنٹیئر ماڈلز کے ساتھ 'خلا کو بند کرتا ہے'

صارفین Claude Opus 4.8 سیاق و سباق کی ونڈو اور صلاحیت میں اچانک کمی کی اطلاع دیتے ہیں۔

میموری ٹولز کس طرح AI ماڈلز کو بدتر بنا سکتے ہیں۔

AI Corpos آپ کا ڈیٹا چوری کرنے سے پریشان ہیں؟ گوگل کا نیا Gemma 4 12B آپ کے لیپ ٹاپ پر مقامی طور پر چل سکتا ہے۔

مائیکروسافٹ کا نیا ٹول devs کو ٹیکسٹ ڈسکرپشن کا استعمال کرتے ہوئے AI رویے کے ٹیسٹ کرنے دیتا ہے۔