AMD اور Intel نے مشترکہ AI کمپیوٹنگ اسٹینڈرڈ بنانے کے لیے مل کر کام کیا ہے جو مستقبل کے پی سی اور لیپ ٹاپ کو AI ایپلی کیشنز چلانے میں تیز تر بنا سکتا ہے جبکہ سافٹ ویئر ڈویلپرز کو ایک ایسا پلیٹ فارم فراہم کرتا ہے جو دونوں کمپنیوں کے پروسیسرز پر کام کرتا ہے۔

نئی ٹیکنالوجی کو بہتر بنانے کے لیے ڈیزائن کیا گیا ہے کہ کس طرح CPUs AI کام کے بوجھ کو ہینڈل کرتے ہیں، جس سے ہم آہنگ ہارڈ ویئر کے آنے پر زیادہ موثر AI پروسیسنگ اور وسیع تر سافٹ ویئر مطابقت پیدا ہوتی ہے۔

دونوں کمپنیوں نے AI کمپیوٹ ایکسٹینشنز (ACE) کے لیے مکمل تفصیلات شائع کی ہیں، جس میں مستقبل کے پروسیسرز پر AI میٹرکس ورک بوجھ کی پروسیسنگ کے لیے مشترکہ x86 معیار قائم کیا گیا ہے۔

تصریح ورژن 1.15 تک پہنچ گئی ہے، جس سے ہم آہنگ ہارڈویئر دستیاب ہونے سے پہلے ڈیولپرز کو AI اور اعلی کارکردگی والے کمپیوٹنگ سافٹ ویئر کے لیے ایک مستحکم ہدف ملتا ہے۔

کسی بھی کمپنی نے ACE کے قابل پروسیسر کا اعلان نہیں کیا ہے۔ 2028 کے آس پاس تک مطابقت پذیر چپس کی توقع نہیں کی جاتی ہے، یعنی سافٹ ویئر کا معیار اس کی حمایت کے لیے ڈیزائن کیے گئے ہارڈ ویئر سے پہلے ہی اچھی طرح پہنچ چکا ہے۔

AI کام کا بوجھ میٹرکس ضرب پر بہت زیادہ انحصار کرتا ہے، لیکن روایتی x86 SIMD ایکسٹینشنز بنیادی طور پر ویکٹر پروسیسنگ کے لیے ڈیزائن کیے گئے تھے۔

AVX اور اس کے بعد کے ورژن قدروں کے طویل، یک جہتی سیٹ پر کارروائی کرتے ہیں۔ تاہم، AI ماڈل اکثر دو جہتی میٹرکس کے ساتھ کام کرتے ہیں، جس سے ان حسابات کے لیے روایتی ویکٹر ہدایات کم موثر ہوتی ہیں۔

GPUs نے سرشار ٹینسر ہارڈ ویئر کے ساتھ اس مسئلے کو حل کیا۔ CPUs اب بھی AI کام کے بوجھ پر کارروائی کر سکتے ہیں، لیکن ان کے پاس ایک عام x86 انسٹرکشن سیٹ کی کمی ہے جو خاص طور پر میٹرکس آپریشنز کے لیے ڈیزائن کیا گیا ہے۔

ACE نے x86 فن تعمیر میں آٹھ دو جہتی ٹائل رجسٹر شامل کیے ہیں۔

ہر ٹائل رجسٹر میں 32 بٹ ویلیوز کا 16 بائی 16 میٹرکس ہو سکتا ہے، جس سے پروسیسرز کو میٹرکس ڈیٹا کو ایسی شکل میں ہینڈل کرنے کی اجازت ملتی ہے جو AI کام کے بوجھ سے بہتر میل کھاتا ہے۔

نئی ہدایات ایک بیرونی پروڈکٹ اپروچ کا استعمال کرتی ہیں، جو کہ AVX10 آپریشن کے مقابلے میں ہر ہدایات کے ساتھ زیادہ میٹرکس حسابات کو مکمل کرتی ہیں۔

AMD اور Intel کا کہنا ہے کہ ACE ان پٹ ویکٹرز کی ایک ہی تعداد کا استعمال کرتے ہوئے ایک مساوی AVX10 ضرب جمع آپریشن کے میٹرکس-کمپیوٹ کثافت سے 16 گنا تک فراہم کر سکتا ہے۔

اس کا مطلب یہ نہیں ہے کہ ہر AI کام کا بوجھ 16 گنا تیزی سے چلے گا۔ اصل کارکردگی کا انحصار عوامل پر ہوگا جیسے میموری بینڈوڈتھ، کمپائلر سپورٹ، اور چپ اسپیس مینوفیکچررز کی مقدار جو ACE ہارڈویئر کے لیے وقف کرتے ہیں۔

تاہم، ACE کو انسٹرکشن اوور ہیڈ کو کم کرنا چاہیے کیونکہ پروسیسرز کو میٹرکس کے کام کی اتنی ہی مقدار کو مکمل کرنے کے لیے کم ہدایات کی ضرورت ہوگی۔ یہ رجسٹروں کے درمیان ڈیٹا کی غیر ضروری نقل و حرکت کو بھی محدود کر سکتا ہے۔

ACE ڈیٹا فارمیٹس کو سپورٹ کرتا ہے جو عام طور پر مصنوعی ذہانت کے لیے استعمال ہوتے ہیں، بشمول INT8، FP8، اور BF16۔

یہ اوپن کمپیوٹ پروجیکٹ کے ذریعے تیار کردہ بلاک اسکیل فارمیٹس کی بھی حمایت کرتا ہے۔ یہ کم درستگی والے فارمیٹس میموری کے استعمال کو کم کر سکتے ہیں اور AI ماڈلز کے لیے پروسیسنگ کی کارکردگی کو بڑھا سکتے ہیں۔

یہ ACE کو اکیلے AVX10 کے مقابلے زیادہ AI پر مرکوز صلاحیتوں کا سیٹ فراہم کرتا ہے۔

انٹیل پہلے ہی اپنے Xeon سرور پروسیسرز میں ایڈوانسڈ میٹرکس ایکسٹینشنز (AMX) پیش کرتا ہے۔

تاہم، AMD اور Intel نے انٹیل کی موجودہ AMX ہدایات کو عام x86 معیار کے طور پر نہیں اپنایا ہے۔ اس کے بجائے، انہوں نے ACE کو ایک علیحدہ مشترکہ توسیع کے طور پر تیار کیا جو موجودہ AMX فریم ورک کے حصوں کو استعمال کرتا ہے۔

ACE وائٹ پیپر میں نامزد 11 مصنفین میں سے آٹھ AMD انجینئر ہیں، جبکہ تین انٹیل سے ہیں۔

ACE کا مقصد انٹیل کے سرور پر مرکوز AMX نفاذ کے مقابلے x86 مصنوعات کی وسیع رینج کے لیے ہے۔ مینوفیکچررز اپنے انفرادی ہارڈویئر ڈیزائن کے لحاظ سے اسے سرورز، لیپ ٹاپس اور ایمبیڈڈ ڈیوائسز میں شامل کر سکتے ہیں۔

ACE x86 پروسیسرز کو بڑی AI تربیتی ملازمتوں یا سب سے زیادہ مطلوبہ انفرنس ورک بوجھ کے لیے Nvidia GPUs کا براہ راست حریف نہیں بنائے گا۔

اس کے بجائے، اسے AI کاموں کے لیے ایک عام میٹرکس-کمپیوٹ فاؤنڈیشن فراہم کرنے کے لیے ڈیزائن کیا گیا ہے جو پہلے سے ہی CPUs پر چلتے ہیں لیکن فی الحال کم موثر طریقے سے کام کرتے ہیں۔

AMD اور Intel کی طرف سے مسلسل نفاذ سے سافٹ ویئر ڈویلپرز کو مختلف پروسیسرز میں میٹرکس پروسیسنگ کے لیے ایک مشترکہ x86 راستہ مل سکتا ہے۔

ACE CPUs کو GPUs میں تبدیل نہیں کرتا ہے، لیکن یہ مستقبل کے x86 پروسیسرز کو AI کیلکولیشن کے لیے وقف کردہ ہدایات دیتا ہے جن کو سنبھالنے کے لیے روایتی ویکٹر ایکسٹینشنز ڈیزائن نہیں کیے گئے تھے۔

جہاں آپ چاہیں تازہ ترین ٹیک خبریں، ٹیلی کام کی بصیرتیں، اور پروڈکٹ لانچ حاصل کریں۔

ProPakistani کو ترجیحی ذرائع میں شامل کریں اور گوگل سرچ اور ٹاپ اسٹوریز میں ہماری مزید کہانیاں دیکھیں۔

شیئرز