AI بوم ایک بنیادی مفروضے پر بنایا گیا ہے: بڑے ماڈل زیادہ طاقتور ہوتے ہیں، اور سب سے زیادہ طاقتور ماڈل جیت جاتے ہیں۔ اب، انڈسٹری سیکھنے والی ہے کہ اگر یہ مفروضہ ٹوٹنا شروع ہو جائے تو کیا ہوتا ہے۔

بڑھتے ہوئے اخراجات نے پہلے ہی صارفین پر دباؤ ڈالا ہے کہ وہ چھوٹے اور سستے ماڈلز کو دوسری شکل دیں۔ لاگت کے لحاظ سے یہ ماڈل شاپنگ نئی ہے اور یہ واضح نہیں ہے کہ اس کا صنعت پر کیا اثر پڑے گا، لیکن اس کے اثرات اہم ہونے کا امکان ہے۔

ایک پیشین گوئی، جو Coinbase کے شریک بانی برائن آرمسٹرانگ نے بہترین انداز میں پیش کی ہے، وہ یہ ہے کہ اس کے نتیجے میں کاموں کی اکثریت سستے ماڈلز پر منتقل ہو جائے گی۔

"ذہانت کی طلب لامحدود کے قریب ہے، لیکن 80% کام کا بوجھ 12-18 مہینوں کے اندر 99% سستے ماڈلز پر چلے گا،" آرمسٹرانگ نے X پر لکھا۔ "20% کام کا بوجھ اب بھی جدید ترین جین ماڈلز پر چلے گا جہاں IQ زیادہ سے زیادہ اہم ہے۔"

یہ بتانا مشکل ہے کہ اگر آرمسٹرانگ کی پیشین گوئی سچ ہو جاتی ہے تو یہ AI انڈسٹری کے لیے کتنی اہم تبدیلی ہو گی۔

اب سے پہلے، زیادہ تر AI کمپنیوں نے معیار پر مقابلہ کیا ہے، جس کا مطلب ہے سب سے زیادہ جدید دستیاب ماڈل کو ڈیفالٹ کرنا۔ اگر وہی ملازمتیں سستے ماڈلز کے ذریعے معیار کو متاثر کیے بغیر سنبھالی جا سکتی ہیں، تو اس کا مطلب AI کی معاشیات میں بڑے پیمانے پر تبدیلی ہو گی۔ اور تنقیدی طور پر، زیادہ تر بچتیں بڑی لیبز کی جیبوں سے نکل رہی ہوں گی، جس سے OpenAI اور Anthropic کو مالیاتی دھچکا لگے گا جیسے وہ اپنے IPO کی طرف بڑھ رہے ہیں۔

یہ صنعت میں ممکنہ طور پر زلزلہ کی تبدیلی ہے، ایک بنیادی سوال پر آرام کرتے ہوئے: کیا کمپنیاں چھوٹے ماڈلز پر جانے کے لیے تیار ہیں؟

ابتدائی ٹیسٹوں سے پتہ چلتا ہے کہ، جب نظام کو درست طریقے سے ترتیب دیا جاتا ہے، تو سستے ماڈل بغیر کسی قربانی کے معیار میں شامل ہو سکتے ہیں۔ قانونی AI ٹول ہاروی کے ایک حالیہ ٹیسٹ میں، کمپنی معیار کو کم کیے بغیر تخمینہ لاگت کو 3x تک کم کرنے میں کامیاب رہی۔ یہ ٹیسٹ، جو انفرنس پلیٹ فارم Fireworks AI کے ساتھ شراکت میں کیا گیا، Claude Opus اور Fireworks کے GLM 5.1 کو ملایا، اور انتہائی گہرے کاموں کے لیے Opus میں شفٹ ہو گیا۔ نتیجہ سرور کے وقت اور مجموعی لاگت کے لحاظ سے نمایاں طور پر کم بوجھ تھا۔

ہاروی کے شریک بانی گیبی پِیریرا نے ٹیک کرنچ کو بتایا کہ "معیار پہلے آتا ہے، اور قانونی طور پر یہ ہمیشہ رہے گا،" اس کا اسٹارٹ اپ فراہم کردہ AI قانونی خدمات کا حوالہ دیتے ہوئے "تاہم، معیار کی تعریف ہر چیز کے لیے سب سے زیادہ طاقتور ماڈل استعمال کرنے سے لے کر بہترین ماڈل کا استعمال کرنے تک تیار ہو رہی ہے جس کا صحیح جواب سب سے زیادہ مؤثر طریقے سے ملتا ہے۔"

یہ رجحان اکثر بڑی لیبز بمقابلہ چینی ماڈلز یا کھلے وزن والے ماڈلز کے لحاظ سے تیار کیا جاتا ہے، لیکن اس سے بڑا نقطہ نظر نہیں آتا۔ اصل تقسیم ملکیتی اور کھلے ماڈلز کے درمیان نہیں ہے۔ یہ بڑے ماڈلز اور چھوٹے ماڈلز کے درمیان ہے۔ آپ GPT-5.5 سے DeepSeek's V4 Flash پر سوئچ کر کے پیسے بچا سکتے ہیں، لیکن GPT-5.4-mini پر سوئچ کرنا بھی اسی طرح کام کرتا ہے۔

بڑی لیبز سے اندرون خانہ اندازہ اور آزادانہ طور پر پیش کیے جانے والے اوپن ویٹ ماڈلز کے درمیان قیمتوں کی ایک فعال جنگ جاری ہے۔ چھوٹے بمقابلہ بڑے کے بڑے سوال کے لیے، اس سے کوئی فرق نہیں پڑتا کہ کس قسم کا چھوٹا ماڈل جیتتا ہے۔

یہ سب کچھ واضح معلوم ہو سکتا ہے — یقیناً آپ کو ضرورت سے زیادہ کمپیوٹ کا استعمال نہیں کرنا چاہیے — لیکن یہ اسکیلنگ فرسٹ اپروچ کے خلاف ہے جو اب تک انڈسٹری پر حاوی ہے۔ تلخ اسباق سے متاثر ہو کر، لیبز نے AI ماڈلز کیا کر سکتے ہیں اس کی سرحد کو آگے بڑھاتے ہوئے، ممکنہ حد تک کمپیوٹ کرنے والے ماڈلز کی تربیت کے لیے سخت جھکاؤ رکھا ہے۔ سرمایہ کاروں کی طرف سے قیمتوں پر بھاری سبسڈی دینے کے ساتھ، گاہکوں کے پاس سب سے جدید آپشن کے علاوہ کچھ بھی منتخب کرنے کی کوئی وجہ نہیں تھی۔

ٹوکن کی قیمتوں میں اضافے اور سبسڈیز میں کمی کے ساتھ، صارفین کو پہلی بار لاگت کے دباؤ کا سامنا ہے۔ ہم نہیں جانتے کہ کیا لاگت کا نیا دباؤ دراصل انٹرپرائز صارفین کو چھوٹے ماڈلز کی طرف لے جائے گا۔ وہ اتنی ہی آسانی سے کم کال کر کے، کم سیاق و سباق کا استعمال کر کے، یا کم سے کم امید افزا تعیناتیوں کو ترک کر کے آسانی سے اقتصادی کر سکتے ہیں۔

لیکن اگر یہ پتہ چلتا ہے کہ زیادہ تر تعیناتیاں ایک چھوٹے ماڈل پر بھی چلائی جا سکتی ہیں، تو یہ تخمینہ کی بڑھتی ہوئی مانگ پر سنگین رکاوٹ ڈال سکتا ہے - اور اس بارے میں نئے سوالات اٹھا سکتا ہے کہ فرنٹیئر ماڈل کی تربیت کی لاگت کو کس طرح درست کیا جائے۔