AI ماڈلز کو چلانے کے لیے کمپیوٹرز کی بڑھتی ہوئی مانگ میں صرف تیزی آئی ہے، لیکن دو بڑی رکاوٹیں ہیں جن پر کاروبار میں کسی کو بھی قابو پانے کی ضرورت ہے: صحیح چپس حاصل کرنا، اور انہیں ڈیٹا سینٹرز تک پہنچانا جہاں سے وہ آمدنی پیدا کرنا شروع کر سکتے ہیں۔

جنرل کمپیوٹ، ایک نیا انفرنس نیوکلاؤڈ — ایک کمپنی جو AI پروسیسنگ پاور کرایہ پر لیتی ہے، اس مرحلے میں مہارت رکھتی ہے جب ماڈلز چل رہے ہوتے ہیں اور تربیت یافتہ ہونے کے بجائے صارفین کو جواب دیتے ہیں — کے پاس ان سوالات کے جوابات ہیں جو روشنی ڈالتے ہیں کہ AI ماحولیاتی نظام کہاں جا رہا ہے۔ ان جوابات نے اسے کیریہ وینچر پارٹنرز اور ولیج گلوبل وینچرز کی شرکت کے ساتھ FUSE VC کی قیادت میں $60 ملین پوسٹ منی ویلیویشن پر $15 ملین سیڈ راؤنڈ بڑھانے میں مدد کی۔

سب سے پہلے، صحیح چپ کیا ہے؟ GPUs کی مانگ چھت سے گزر چکی ہے، لیکن یہ روایتی دانشمندی بنتی جا رہی ہے کہ تربیت حاصل کرنے کے بعد وہ AI ماڈلز کو چلانے کے لیے موزوں ترین چپس نہیں ہیں۔ AI کا وہ مرحلہ جہاں ایک ماڈل فعال طور پر ردعمل پیدا کر رہا ہے اس کی تربیت سے مختلف کمپیوٹیشنل تقاضے ہیں، اور اس کے لیے خاص طور پر چپس کی ایک نئی کلاس تیار کی جا رہی ہے۔ دسمبر میں Nvidia کا $20 بلین Groq ٹرانزیکشن اور Cerebras کا $57 بلین IPO پچھلے ہفتے اس طرف اشارہ کرتا ہے۔

ان دونوں کمپنیوں کی صلاحیت میں کمی کے ساتھ، جنرل کمپیوٹ کے شریک بانی، سی ای او فن پکلوسکی اور سی ٹی او جیسن گوڈیسن نے ایک اور آپشن تلاش کیا۔ وہ سامبا نووا کی طرف سے تیار کردہ خصوصی چپس کی طرف رجوع کر رہے ہیں، جو ایک انٹیل کی حمایت یافتہ چپ میکر ہے جس نے اس تخمینے پر توجہ مرکوز کی ہے جو سلیکن ویلی کی گفتگو سے تھوڑا سا ہٹ گئی ہے۔

یہ اس وقت تبدیل ہو سکتا ہے جب SambaNova اس سال اپنی نئی چپس جاری کرے گا۔ فن تعمیر زیادہ لچکدار ہے اور تخمینے کے حساب کتاب کے دوران سیاق و سباق کو ذخیرہ کرنے کے لیے زیادہ میموری استعمال کرتا ہے، اور SambaNova کا دعویٰ ہے کہ یہ نہ صرف GPUs بلکہ Groq یا Cerebras کی پسند کے ذریعے بنائے گئے دیگر خصوصی چپس کو بھی پیچھے چھوڑتا ہے۔ پکلوسکی کا کہنا ہے کہ نئے چپس 600 سے 700 ٹوکن فی سیکنڈ پیدا کریں گے، بمقابلہ GPUs کے لیے تقریباً 250 ٹوکن فی سیکنڈ۔

جنرل کمپیوٹ کے پاس کمپنی کی SN50 چپس میں سے $300 ملین آرڈر پر ہیں اور ان کا کہنا ہے کہ یہ انہیں تعینات کرنے والا پہلا نیوکلاؤڈ ہوگا۔

یہ چپس دوسرے بڑے مسئلے کو حل کرنے میں بھی مدد کرتی ہیں — انہیں کہاں رکھنا ہے — جنرل کمپیوٹ کے لیے: یہ ایئر کولڈ ہیں، واٹر کولڈ نہیں، اور کم بجلی استعمال کرتے ہیں، اس لیے انہیں بنیادی ڈھانچے کی نئی سرمایہ کاری کے بغیر موجودہ ڈیٹا سینٹر کی سہولیات میں انسٹال کیا جا سکتا ہے۔

Puklowski colocation کے سودوں کی پِیروی کر رہا ہے - ایسے انتظامات جہاں جنرل Compute اپنے ہارڈ ویئر کو کسی اور کی سہولت میں انسٹال کرتا ہے - نہ صرف ڈیٹا سینٹر فراہم کرنے والوں کے ساتھ، بلکہ کرپٹو کان کنوں کے ساتھ بھی جو اپنے بنیادی ڈھانچے کو دوبارہ تیار کرنے کے خواہاں ہیں کیونکہ بٹ کوائن کی پیداوار کی لاگت اکثر اس کی قیمت سے تجاوز کر گئی ہے۔

جنرل کمپیوٹ نے گزشتہ ہفتے اپنی کلاؤڈ پیشکش کا آغاز کیا، یہ دعویٰ کیا کہ یہ پہلے سے ہی ایک طاقتور اوپن سورس LLM MiniMax 2.7 چلانے میں سب سے تیز ہے۔

Joe Hassleman ایک وینچر سرمایہ کار ہے جس نے 2021 میں Groq میں سرمایہ کاری کرتے وقت انفرنس بوم کے گراؤنڈ فلور پر قدم رکھا۔ اس سال، اس نے ایک نیا فنڈ، Evercrest Partners شروع کیا، جس نے AI اسپیس پر توجہ مرکوز کی، اور جنرل کمپیوٹ کو اپنی پہلی سرمایہ کاری کی۔ Hasleman جنرل کمپیوٹ کے ساتھ SambaNova کی شراکت کو Nvidia کے ساتھ Coreweave کے تعلقات کے متوازی دیکھتا ہے - اور Groq کی چپ سازی کو اس کی سابقہ ​​کلاؤڈ پیشکش کے ساتھ جوڑتا ہے۔

ہاسل مین نے کہا کہ "انہیں صارفین کے ایک صحت مند مرکب کی ضرورت ہے جو اپنے چپس کو ایسے ماحول میں ڈالیں گے جو ان کے لیے بہت زیادہ ترقی کر رہے ہوں،" ہاسل مین نے کہا۔ "جتنا جنرل کمپیوٹ SambaNova پر شرط لگا رہا ہے، SambaNova جنرل کمپیوٹ پر شرط لگا رہا ہے۔"

سوال یہ ہے کہ AI مستقبل میں کس قسم کا کمپیوٹر فن تعمیر سب سے زیادہ اہمیت حاصل کرے گا۔ انفرنس کلاؤڈز متعدد ماڈلز اور ایجنٹوں کی دنیا پر مضمر شرط ہیں، جہاں کوئی ایک فراہم کنندہ غالب نہیں ہوتا اور رفتار اور تخمینہ کی قیمت کلیدی مسابقتی متغیرات بن جاتی ہے۔ اس ہفتے OpenRouter کے لیے اکٹھے کیے گئے $113 ملین Series B پر غور کریں، جو کہ صارفین کو ان کے ٹوکن خرچ کو بہتر بنانے کے لیے متعدد ماڈلز تک رسائی کی پیشکش کرنے کی کمپنی کی صلاحیت کو ظاہر کرتا ہے۔

اس حساب میں، قیمت کے لیے، اور صلاحیت کے لیے رفتار اہمیت رکھتی ہے۔ Puklowski کوڈنگ ایجنٹوں کے لیے گھنٹوں طویل کام کے بوجھ کو پانچ یا دس منٹ کے کاموں میں تبدیل کرنا چاہتا ہے، اور کسٹمر سروس کے لیے آڈیو ایجنٹ بنانا چاہتا ہے، جس کے لیے مؤثر طریقے سے بات چیت کرنے کے لیے تیز تر اندازہ کی ضرورت ہوتی ہے، زیادہ اقتصادی۔ "اگر آپ ChatGPT استعمال کرتے ہیں اور یہ آپ کو 50 ٹوکن فی سیکنڈ دیتا ہے، تو یہ اب بھی ہمارے پڑھنے سے کہیں زیادہ تیز ہے،" Puklowski نے TechCrunch کو بتایا، "اب جب کہ چیزیں ایجنٹ سے ایجنٹ تک منتقل ہو گئی ہیں، جہاں ایجنٹ ہماری طرف سے پڑھ رہے ہیں یا ڈیٹا بیس کو پنگ کر رہے ہیں، انہیں تیزی سے جانے کی ضرورت ہے۔"