پوری صنعت میں، کمپنیاں AI کی قیمت پر کم کرنا شروع کر رہی ہیں۔ Uber نے اپریل تک اپنے پورے 2026 AI کوڈنگ بجٹ کو اڑا دیا۔ مائیکروسافٹ نے اپنے ڈویلپرز کے کلاڈ کوڈ کے لائسنس کو فعال کرنے کے مہینوں بعد منسوخ کر دیا۔ پرائس لائن کے ایک ملازم نے ٹیک کرنچ کو بتایا کہ کرسر کے معاہدے کی معمول کی تجدید 4-5 گنا زیادہ مہنگی واپس آتی ہے۔

اگرچہ فی ٹوکن قیمتیں گر گئی ہیں، زیادہ AI کو اپنانے کے لیے دباؤ اور بڑھتے ہوئے خود مختار ایجنٹوں نے ٹوکن کی کھپت کو زیادہ سے زیادہ بڑھا دیا ہے۔ وہ کمپنیاں جنہوں نے 2025 کے اوائل میں سبسکرپشنز پر جو آپ کھا سکتے ہیں، اب یہ سمجھنے کے لیے جھنجھلا رہے ہیں کہ ان کا پیسہ کہاں جا رہا ہے، اخراجات کو واپس لیں، اور یہ معلوم کریں کہ آیا وہ اپنے بجٹ کے ملبے سے کچھ ROI بچا سکتی ہیں۔

اس دوران وہاں ان سے ملنے کے لیے ایک بازار بن رہا ہے۔ اسٹارٹ اپس، قائم کردہ وینڈرز، اور ایک نئی معیاری باڈی سبھی کمپنیوں کو ٹولز اور زبان دینے کے لیے دوڑ رہے ہیں کہ وہ کیا خرچ کرتے ہیں۔

"چھ مہینے پہلے، میں ایک گاہک کے ساتھ بات چیت کروں گا اور یہ سب کچھ اس بارے میں ہوگا کہ 'یہ کیا کر سکتا ہے؟ کیا یہ کافی اچھا ہے؟'" اوپن اے آئی کے انٹرپرائز کے سربراہ الیگزینڈر ایمبریکوس نے اس ہفتے نیویارک شہر میں ایک تقریب میں ٹیک کرنچ کو بتایا۔ "ہماری گفتگو اب اس کے بارے میں کبھی نہیں ہے۔ اب بات چیت اس بارے میں ہے، 'ارے، ہم بہت زیادہ خرچ کر رہے ہیں۔ آپ کے پاس کیا مرئیت ہے؟ آپ کے پاس کون سی آڈیٹیبلٹی ہے؟ آپ کے پاس کون سے ٹوکن کنٹرول ہیں؟ آپ کے ماڈلز کی کارکردگی کیا ہے؟'"

یہ اس پس منظر کے خلاف ہے کہ لینکس فاؤنڈیشن نے اس ہفتے ٹوکنومکس فاؤنڈیشن کے لیے منصوبوں کی نقاب کشائی کی، جو کہ ایک نئی اسٹینڈرڈ باڈی ہے جس کا مقصد AI ٹوکنز کے ارد گرد وہی لاگت کا نظم و ضبط قائم کرنا ہے جو FinOps نے کلاؤڈ اخراجات کے لیے کیا تھا۔

"اپریل اور مئی میں، میں نے کمپنیوں سے سننا شروع کیا: 'اوہ میرے خدا، ہم اپنے پورے 2026 کے ٹوکن بجٹ سے 3 گنا زیادہ ہیں اور یہ صرف اپریل ہے،'" لینکس فاؤنڈیشن کے تحت ایک پروجیکٹ FinOps فاؤنڈیشن کے ایگزیکٹو ڈائریکٹر J.R Storment نے TechCrunch کو بتایا۔ "ہم نے وجودی بحرانوں کو سننا شروع کیا، اور پوری گفتگو ٹوکن میکسنگ اور 'تیز رفتاری سے چلیں' سے 'ہمیں گارڈریلز کی ضرورت ہے، ہم اسے کیسے کنٹرول کریں گے؟'"

ٹیک کی دنیا میں سنائی دینے والی چیخیں سی ای اوز کے پرجوش مطالبات کی پِیروی کرتی ہیں جنہوں نے اپنی ٹیموں کو بہترین ماڈل استعمال کرنے اور تیزی سے آگے بڑھنے پر زور دیا، اخراجات کو نقصان پہنچایا جائے۔ نومبر میں ریلیز ہونے والے نئے ماڈلز جیسے Anthropic's Claude Opus 4.5، OpenAI's GPT-5.1، اور Google کے Gemini 3 Pro نے ایجنٹی ٹولز میں نمایاں بہتری لائی ہے، جس کی کھپت میں کئی گنا اضافہ ہوا ہے۔ اس طرح ایک کمپنی نے مبینہ طور پر ملازمین کے لیے استعمال کی حد مقرر کرنا بھول جانے کے بعد اپنے آپ کو $500 ملین کلاڈ بل کے ساتھ پایا۔

"یہ کریک کوکین کی وبا کی طرح ہے،" پرائس لائن میں آئی ٹی فنانس کے سینئر ڈائریکٹر کرس ریڈ نے کہا، یہ نوٹ کرتے ہوئے کہ کمپنی نے مخصوص گروپوں پر ٹوکن کی حدیں لگانا شروع کر دی ہیں۔ "انہوں نے آپ کو اس کی طرف راغب کرنے کی کوشش کرنے کی اجازت دی ، اور اب آپ اس کی طرف دیکھ رہے ہیں۔"

انجینئرنگ آپریشنز پلیٹ فارم فاروس اے آئی کے سی ای او وٹالی گورڈن نے کہا کہ انہوں نے حال ہی میں ایک سی ٹی او سے بات کی جس نے انہیں بتایا: "میرے ایک انجینئر نے پچھلے مہینے ٹوکنز پر $40000 خرچ کیے، اور میں حقیقی طور پر نہیں جانتا کہ مجھے اسے روکنا چاہیے یا مجھے جا کر باقی سب کو اس جیسا بننے کے لیے کہنا چاہیے۔"

فاروس کے مارچ کے سروے میں پتا چلا ہے کہ 20000 ڈویلپرز کے درمیان، آؤٹ پٹ بڑھ رہا تھا، لیکن اسی طرح کیڑے اور دوبارہ لکھے گئے۔ جیلی فش، ایک انجینئرنگ مینجمنٹ پلیٹ فارم، نے اسی طرح ایسے انجینئرز کو پایا جنہوں نے سب سے زیادہ ٹوکن استعمال کیے ان لوگوں کے مقابلے میں تقریباً دو گنا زیادہ پیداواری تھے جنہوں نے AI کم استعمال کیا، لیکن انہوں نے وہاں پہنچنے کے لیے ٹوکن کی تعداد 10 گنا خرچ کی۔

جیلی فش کے ریسرچ کے سربراہ نکولس آرکولانو نے ای میل کے ذریعے ٹیک کرنچ کو بتایا کہ ایجنٹی خصوصیات کی وجہ سے اے آئی پر اخراجات بڑے پیمانے پر پھٹ رہے ہیں، نو مہینوں میں فی ڈویلپر کی کھپت تقریباً 18.6 گنا بڑھ رہی ہے۔ مجموعی طور پر، یہ اعدادوشمار پیداواریت کے معاملے کو اخراجات کی تجویز سے کہیں زیادہ پیچیدہ بنا دیتے ہیں۔

آرکولانو نے کہا، "چاہے بہت زیادہ اخراجات کی ادائیگی بھیجے گئے کوڈ کی حتمی کاروباری قیمت (جیسے محصول) پر آتی ہے، جس کی زیادہ تر کمپنیاں اب بھی پیمائش نہیں کر سکتیں۔"

کم از کم اس پیمائش کا کچھ مسئلہ سراسر پیمانے کا ہے جس پر آج AI استعمال ہو رہا ہے۔

سٹورمنٹ نے کہا کہ "کلاؤڈ لاگت کا سراغ لگانا سیکڑوں لاکھوں قطاروں میں ایک ماہ کے ڈیٹا کا مسئلہ ہے۔" "ٹوکن کی لاگت کا سراغ لگانا ایک ٹریلین-آف قطار-ایک ماہ کے ڈیٹا کا مسئلہ ہے۔ آپ اسے کسی بھی اسپریڈشیٹ یا حتیٰ کہ بنیادی ٹول میں نہیں رکھ سکتے۔ ایسا کرنے کے لیے آپ کو اپنے ٹولنگ، اپنے چشموں اور اپنے اکاؤنٹنگ سسٹم پر بنیادی طور پر نظر ثانی کرنی ہوگی۔"

پرائس لائن پر، ریڈ پہلے سے ہی تضادات دیکھ رہا ہے۔ اس نے وینڈر کے رپورٹ کردہ استعمال اور پرائس لائن کے اندرونی ڈیٹا کے درمیان مسائل کو نوٹ کیا۔ انہوں نے کہا، "میں نے اپنے کیریئر کا آغاز ٹیلی کام اخراجات کے انتظام میں کیا، اور میں ٹیلی کام سے کلاؤڈ سے AI تک تمام ایک جیسے متوازی دیکھ رہا ہوں۔" "جب بھی آپ کچھ نیا متعارف کراتے ہیں، یہ بلنگ کی غلطیوں اور آڈٹ اور اصلاح کے مواقع کے لیے موزوں ہے۔"

اس مسئلے کے گرد ایک مارکیٹ بننا شروع ہو رہی ہے۔ پیور پلے کمپنیاں ہیں، جیسے Pay-i، جو GenAI سرمایہ کاری کے اخراجات اور کارکردگی کو ٹریک کرتی ہے، پیمائش کرتی ہے اور بہتر کرتی ہے۔ ادا کردہ، اس دوران، ڈیولپرز کو سبسکرپشن فیس کی بجائے اصل قیمت کی بنیاد پر لاگت کو ٹریک کرنے، استعمال کی پیمائش اور صارفین کو بل کرنے دیتا ہے۔

اس کے بعد جیلی فش، وائیڈیو اور فاروس اے آئی جیسی کمپنیاں ہیں، جو سبھی ڈویلپر ٹولز کے ROI کو ثابت کرنے کے لیے AI ایجنٹ کی نگرانی فراہم کرتی ہیں۔ طوفان کا کہنا ہے کہ FinOps فاؤنڈیشن کے اندر 180 دکانداروں میں سے زیادہ تر اس جگہ کی طرف جھکاؤ رکھتے ہیں۔

موجودہ ڈسٹری بیوشن والی کمپنیاں اس نئی مارکیٹ سے فائدہ اٹھانے کے لیے نئی خصوصیات بھی شامل کر رہی ہیں۔ ریمپ حال ہی میں AI اخراجات کے انتظام میں منتقل ہوا ہے۔ Datadog اور New Relic نے کلاؤڈ لاگت کا انتظام، ٹوکن لیول آبزرویبلٹی، اور GPU مانیٹرنگ جیسی خدمات پر کام کیا ہے۔ اگلے ہفتے FinOps X کانفرنس میں، AWS سے توقع کی جاتی ہے کہ وہ نئی مالیاتی انتظامی خصوصیات متعارف کرائے گی جو انٹرپرائز AI اخراجات کے لیے تیار ہیں۔

NEA کے ایک پارٹنر، Tiffany Luck کا خیال ہے کہ "ہارنس یا ایپ لیئر" میں ٹوکن کی کارکردگی اور مشاہدے کو ممکنہ طور پر شامل کیا جائے گا۔ اس نے فیکٹری کی طرف اشارہ کیا، ایک اسٹارٹ اپ جو انٹرپرائزز کے لیے AI ایجنٹس بناتا ہے، جس نے اس ہفتے ایک ماڈل راؤٹر لانچ کیا جو ہر کام کے لیے خود بخود صحیح ماڈل چنتا ہے۔

گورڈن توقع کرتا ہے کہ فرنٹیئر لیبز اور دیگر ماڈل فراہم کنندگان اوپن روٹر طرز کی اصلاح کو اپنائیں گے تاکہ سوالات کو سستے ترین ماڈلز تک پہنچایا جا سکے - یہ رجحان پہلے سے ہی انٹرپرائز کلاڈ بلز پر نظر آ رہا ہے۔

گورڈن نے کہا، "آپ انتھروپک پر کتنا خرچ کرتے ہیں اس کی مالی رپورٹ، یہاں تک کہ اگر آپ اوپس ماڈل کہتے ہیں، تو کچھ خرچ سونیٹ یا ہائیکو پر ہوگا، کیونکہ وہ اسے کرنے کے لیے کافی ہوشیار ہیں،" گورڈن نے کہا۔ "مجھے لگتا ہے کہ یہ زیادہ سے زیادہ چیز بن جائے گا۔"

لیکن یہ تمام ٹولز ایک مشترکہ زبان یا مشترکہ تعریف کے بغیر بنائے جا رہے ہیں کہ ٹوکن کی کتنی لاگت آتی ہے، اس سے کیا پیدا ہوتا ہے، اور وینڈرز کے خرچ کا موازنہ کیسے کیا جائے۔ یہی وہ جگہ ہے جہاں ٹوکنومکس فاؤنڈیشن کو کارآمد ثابت ہونے کی امید ہے۔

فاؤنڈیشن "ٹوکنومکس" کے لیے ایک کیننیکل تعریف اور فریم ورک بنا رہی ہے۔ AI ٹوکن کے استعمال اور بلنگ کے لیے کھلے معیارات، وضاحتیں اور میٹرکس؛ نیز AI اکنامکس کے لیے نئے میٹرکس، جیسے لاگت فی ذہانت یا ٹوکن فی واٹ۔ یہ ٹوکن فیکٹری کی تاثیر اور کھپت کی کارکردگی میں میٹرکس کی وضاحت کرنے کا بھی ارادہ رکھتا ہے۔ گروپ جولائی میں باضابطہ آغاز کی منصوبہ بندی کر رہا ہے، اور اگلے ہفتے FinOps X کانفرنس میں مزید اراکین کا اعلان کرنے والا ہے۔

سیلز فورس کے چیف دستیابی آفیسر نشانت گپتا نے ایک بیان میں کہا کہ "ٹوکن اکنامکس بنیادی طور پر اس پیمانے پر کسی بھی چیز سے زیادہ تجریدی اور مبہم ہے۔ "اس کے لیے ایک مختلف آپریشنل پٹھوں کی ضرورت ہوتی ہے جو صنعت نے کلاؤڈ کے لیے بنائی تھی۔"

اس نے کہا، Goldman Sachs نے 2030 تک عالمی ٹوکن کے استعمال کو 24 گنا تک بڑھانے کا منصوبہ بنایا ہے۔ پہلے سے بجٹ سے زیادہ کمپنیوں کو اب حل کی ضرورت ہے، اور فاؤنڈیشن کی پہلی ڈیلیوری ابھی مہینوں دور ہے۔

"شاید ہم نے بھاپ کا انجن بنایا ہو، لیکن ہم نے ابھی تک اسمبلی لائن کا پتہ نہیں لگایا،" گورڈن نے کہا۔

آرکولانو کے مطابق، سمارٹ اقدام وسیع، اعتدال پسند اپنانے والا ہے۔

انہوں نے کہا کہ "بہترین ROI وسیع مڈل کو کم سے اعتدال پسند استعمال میں منتقل کرنے سے حاصل ہوتا ہے، نہ کہ بھاری صارفین کو زیادہ دھکیلنے سے،" انہوں نے کہا۔

رسل برانڈم اور ٹم فرن ہولز نے اس رپورٹنگ میں تعاون کیا۔