AI ماڊلز کي هلائڻ لاءِ ڪمپيوٽرن جي وڌندڙ طلب صرف تيز ٿي وئي آهي ، پر اتي ٻه وڏيون رڪاوٽون آهن جن کي ڪاروبار ۾ ڪنهن کي به دور ڪرڻ جي ضرورت آهي: صحيح چپس حاصل ڪرڻ ، ۽ انهن کي ڊيٽا سينٽرن ۾ حاصل ڪرڻ جتي اهي آمدني پيدا ڪرڻ شروع ڪري سگهن ٿا.
General Compute، هڪ نئون inference neocloud - هڪ ڪمپني جيڪا AI پروسيسنگ پاور کي ڪرائي تي ڏئي ٿي، ان مرحلي ۾ ماهر ٿي جڏهن ماڊلز هلائي رهيا آهن ۽ استعمال ڪندڙن کي تربيت ڏيڻ بجاءِ جواب ڏئي رهيا آهن - انهن سوالن جا جواب آهن جيڪي روشني ڏين ٿا ته AI ماحولياتي نظام ڪٿي وڃي رهيو آهي. انهن جوابن ان جي مدد ڪئي $15 ملين سيڊ راؤنڊ ۾ $60 ملين پوسٽ-پيسي جي قيمت تي، جنهن جي اڳواڻي FUSE VC ڪرييا وينچر پارٽنرز ۽ ڳوٺ گلوبل وينچرز جي شرڪت سان.
پهرين، صحيح چپ ڇا آهي؟ GPUs جي گهرج ڇت جي ذريعي ٿي چڪي آهي، پر اهو روايتي حڪمت وارو ٿي رهيو آهي ته اهي AI ماڊل هلائڻ لاء بهترين مناسب چپس نه آهن جڏهن انهن کي تربيت ڏني وئي آهي. AI جو مرحلو جتي هڪ ماڊل فعال طور تي ردعمل پيدا ڪري رهيو آهي تربيت جي ڀيٽ ۾ مختلف ڪمپيوٽيشنل گهرجون آهن، ۽ چپس جو هڪ نئون طبقو خاص طور تي ان لاءِ ٺاهيو پيو وڃي. Nvidia جي ڊسمبر ۾ $ 20 بلين Groq ٽرانزيڪشن ۽ Cerebras جي $ 57 بلين IPO گذريل هفتي جو رستو اشارو ڪيو.
انهن ٻنهي ڪمپنين تي دٻاءُ جي صلاحيت سان، جنرل ڪمپيوٽ جي گڏيل باني، سي اي او فين پوڪلوسڪي ۽ سي ٽي او جيسن گڊيسن، هڪ ٻيو آپشن مليو. اهي سامبا نووا پاران ٺاهيل اسپيشل چپس ڏانهن رخ ڪري رهيا آهن، هڪ Intel-backed chipmaker جو ڌيان ان ڳالهه تي آهي ته سلکان وادي جي گفتگو کان ٿورو ٻاهر نڪري ويو آهي.
اھو تبديل ٿي سگھي ٿو جڏھن سامبا نووا ھن سال پنھنجي نئين چپس جاري ڪري ٿي. آرڪيٽيڪچر وڌيڪ لچڪدار آهي ۽ وڌيڪ ميموري استعمال ڪري ٿو حوالن کي ذخيرو ڪرڻ لاءِ inference حسابن جي دوران، ۽ SambaNova دعويٰ ڪري ٿو ته اهو نه صرف GPUs کان وڌيڪ پرفارم ڪري ٿو پر ٻين خاص چپس کي به ٺاهي ٿو جيڪي Groq يا Cerebras جي پسندن سان ٺهيل آهن. Puklowski چوي ٿو نئين چپس 600 کان 700 ٽوڪن في سيڪنڊ پيدا ڪندي، GPUs لاءِ اٽڪل 250 ٽوڪن في سيڪنڊ جي مقابلي ۾.
جنرل ڪمپيوٽ وٽ آرڊر تي ڪمپني جي SN50 چپس مان 300 ملين ڊالر آهن ۽ چون ٿا ته اهو انهن کي ترتيب ڏيڻ وارو پهريون نيو ڪلائوڊ هوندو.
اهي چپس ٻئي وڏي مسئلي کي حل ڪرڻ ۾ پڻ مدد ڪن ٿيون- انهن کي ڪٿي رکڻو آهي- جنرل ڪمپيوٽ لاءِ: اهي ايئر ڪولڊ آهن، واٽر ڪولڊ نه آهن، ۽ گهٽ بجلي استعمال ڪن ٿيون، تنهن ڪري اهي موجوده ڊيٽا سينٽر سهولتن ۾ نصب ٿي سگهن ٿيون بغير نئين انفراسٽرڪچر جي سيڙپڪاري جي.
Puklowski colocation deals جي تعاقب ڪري رهيو آهي - انتظام جتي جنرل ڪمپيوٽ پنهنجي هارڊويئر کي ڪنهن ٻئي جي سهولت ۾ نصب ڪري ٿو - نه صرف ڊيٽا سينٽر فراهم ڪندڙن سان، پر پڻ crypto miners سان گڏ انهن جي انفراسٽرڪچر کي ٻيهر بحال ڪرڻ جي ڪوشش ڪري رهيا آهن جيئن ته هڪ bitcoin پيدا ڪرڻ جي قيمت گهڻو ڪري ان جي قيمت کان وڌي وئي آهي.
جنرل ڪمپيوٽ گذريل هفتي پنهنجي ڪلائوڊ پيشڪش شروع ڪئي، دعويٰ ڪئي ته اها اڳ ۾ ئي تيز ترين آهي MiniMax 2.7 هلائڻ ۾، هڪ طاقتور اوپن سورس LLM.
Joe Hassleman هڪ وينچر سيڙپڪار آهي جيڪو انفرنس بوم جي گرائونڊ فلور تي آيو جڏهن هن 2021 ۾ Groq ۾ سيڙپڪاري ڪئي. هن سال، هن هڪ نئون فنڊ شروع ڪيو، Evercrest Partners، AI اسپيس تي ڌيان ڏنو، ۽ جنرل Compute کي پنهنجي پهرين سيڙپڪاري ڪئي. Hassleman ڏسي ٿو SambaNova جي شراڪت ۾ جنرل ڪمپيوٽ سان Coreweave جي لاڳاپن سان متوازي Nvidia سان - ۽ Groq جي چپ ٺاھڻ جي جوڙي کي ان جي اڳوڻي بادل جي پيشڪش سان.
"انهن کي گراهڪن جي هڪ صحتمند ميلاپ جي ضرورت آهي جيڪي انهن جي چپس کي ماحول ۾ رکڻ وارا آهن جيڪي انهن لاء اعلي ترقي وارا آهن،" Hassleman چيو. ”جيترو جنرل ڪمپيوٽ سامبا نووا تي شرط لڳائي رهيو آهي، سامبا نووا جنرل ڪمپيوٽ تي شرط لڳائي رهيو آهي.
سوال اهو آهي ته ڪهڙي قسم جو ڪمپيوٽر فن تعمير AI مستقبل ۾ سڀ کان وڌيڪ قيمت تي قبضو ڪندو. Inference بادل ڪيترن ئي ماڊلز ۽ ايجنٽن جي دنيا تي بيشمار شرطون آهن، هڪ جتي ڪو به هڪ فراهم ڪندڙ غالب نه آهي ۽ رفتار ۽ قيمت جي قيمت اهم مسابقتي متغير بڻجي ويندا آهن. غور ڪريو $113 ملين سيريز بي هن هفتي OpenRouter لاءِ اٿاريو، ڪمپني جي صلاحيت کي ظاهر ڪري ٿو گراهڪن کي ڪيترن ئي ماڊل تائين رسائي پيش ڪرڻ جي لاءِ انهن جي ٽوڪن جي خرچ کي بهتر ڪرڻ لاءِ.
رفتار جو معاملو ان حساب سان، قيمت لاء، ۽ صلاحيت لاء. Puklowski چاهي ٿو ڪوڊنگ ايجنٽن لاءِ ڪلاڪ ڊگھي ڪم جي لوڊ کي پنجن يا ڏهن منٽن جي ڪمن ۾ تبديل ڪرڻ، ۽ ڪسٽمر سروس لاءِ آڊيو ايجنٽ ٺاهڻ، جن کي موثر انداز ۾ گفتگو ڪرڻ لاءِ تيز تر انفرنس جي ضرورت آهي، وڌيڪ اقتصادي. "جيڪڏهن توهان ChatGPT استعمال ڪريو ٿا ۽ اهو توهان کي 50 ٽوڪن في سيڪنڊ ڏئي ٿو، اهو اڃا تائين تمام گهڻو تيز آهي جيڪو اسان پڙهي سگهون ٿا،" Puklowski TechCrunch کي ٻڌايو، "هاڻي اهي شيون ايجنٽ کان ايجنٽ ڏانهن منتقل ٿي ويا آهن، جتي ايجنٽ اسان جي طرفان پڙهي رهيا آهن يا ڊيٽابيس کي پنگ ڪري رهيا آهن، انهن کي تيز ٿيڻ جي ضرورت آهي."