د AI بوم په بنسټیز انګیرنه کې رامینځته شوی: لوی ماډلونه خورا پیاوړي دي، او خورا پیاوړي ماډلونه ګټل کیږي. اوس، صنعت د زده کړې په اړه دی چې څه پیښیږي که چیرې دا انګیرنه مات شي.
لوړ لګښتونه دمخه په کاروونکو فشار راوړي ترڅو کوچني او ارزانه ماډلونه دوهم لید ورکړي. دا د لګښت په اړه د پام وړ ماډل پیرود نوی دی او دا څرګنده نده چې دا به په صنعت څه اغیزه وکړي، مګر احتمال یې د پام وړ دی.
یوه وړاندوینه، چې د Coinbase شریک بنسټ ایښودونکي براین آرمسټرانګ لخوا غوره شوې، دا ده چې دا به د ارزانه موډلونو ته د ډیری دندو د لیږد نتیجه وي.
"د استخباراتو غوښتنه لامحدود ته نږدې ده، مګر د کار بار 80٪ به په 12-18 میاشتو کې په 99٪ ارزانه ماډلونو کې پرمخ ځي،" آرمسټرانګ په X کې لیکلي. "د کاري بارونو 20٪ به لاهم په وروستي نسل ماډلونو کې پرمخ ځي چیرې چې د IQ اعظمي کول مهم دي."
دا سخته ده چې د AI صنعت لپاره به څومره مهم بدلون وي که د آرمسټرانګ وړاندوینه ریښتیا شي.
تر دې دمه، د AI ډیری شرکتونو د کیفیت په اړه سیالي کړې، چې دا د خورا پرمختللي موجود ماډل لپاره د ډیفالټ معنی لري. که دا ورته دندې د کیفیت اغیزه کولو پرته د ارزانه ماډلونو لخوا اداره کیدی شي ، نو دا به د AI په اقتصاد کې د لوی بدلون معنی ولري. او په انتقادي توګه، د سپما ډیره برخه به د لویو لابراتوارونو جیبونو څخه راوتلي وي، د OpenAI او انتروپیک ته د مالي تاوان سره مخامخ کوي لکه څنګه چې دوی د خپلو IPOs په لور روان دي.
دا په صنعت کې د احتمالي زلزلې بدلون دی، په یوې اساسي پوښتنې پاتې دي: ایا شرکتونه چمتو دي چې کوچني ماډلونو ته لاړ شي؟
ابتدايي ازموینې وړاندیز کوي، کله چې سیسټم په سمه توګه تنظیم شوی وي، ارزانه ماډلونه کولی شي د کیفیت له کومې قربانۍ پرته داخل شي. د قانوني AI وسیلې هاروي لخوا په وروستي ازموینه کې ، شرکت وتوانید چې د کیفیت کمولو پرته د 3x لخوا د محاسبې لګښتونه کم کړي. ازموینه، د انفرنس پلیټ فارم Fireworks AI سره په ملګرتیا کې ترسره شوې، د کلاډ Opus او Fireworks GLM 5.1 سره یوځای شوی، او د خورا سختو کارونو لپاره Opus ته لیږدول شوی. پایله د سرور وخت او ټولیز لګښت له مخې د پام وړ ټیټ بار و.
"کیفیت لومړی راځي ، او په قانوني کې دا تل به وي ،" د هاروي شریک بنسټ ایښودونکی ګبي پیریرا ټیک کرنچ ته وویل ، د AI قانوني خدماتو ته اشاره کوي چې د هغه پیل وړاندې کوي. "په هرصورت، د کیفیت تعریف په ساده ډول د هر څه لپاره د خورا پیاوړي ماډل کارولو څخه، د غوره ماډل کارولو څخه چې سم ځواب په خورا اغیزمن ډول ترلاسه کوي وده کوي."
دا رجحان اکثرا د چینايي ماډلونو یا خلاص وزن لرونکي په پرتله د لوی لابراتوارونو شرایطو کې رامینځته کیږي ، مګر دا لوی ټکی له لاسه ورکوي. اصلي ویش د ملکیت او خلاص ماډلونو ترمینځ ندی؛ دا د لویو او کوچنیو ماډلونو ترمنځ دی. تاسو کولی شئ د GPT-5.5 څخه ډیپ سیک V4 فلش ته په بدلولو سره پیسې خوندي کړئ ، مګر GPT-5.4-mini ته بدلول هم ورته کار کوي.
د لویو لابراتوارونو او په خپلواکه توګه د خلاص وزن ماډلونو څخه د کور دننه اټکلونو ترمینځ د نرخ فعاله جګړه روانه ده. د کوچني په مقابل کې د لویې پوښتنې لپاره ، دا واقعیا مهمه نده چې کوم ډول کوچني ماډل وګټي.
دا ټول ممکن څرګند ښکاري - البته تاسو باید د اړتیا څخه ډیر محاسبه ونه کاروئ - مګر دا د پیمانه کولو - لومړۍ کړنلارې سره مقابله کوي چې تر دې دمه صنعت تسلط لري. د ترخه درس څخه الهام اخستلو سره، لابراتوارونو د امکان تر حده د ډیرو کمپیوټري ماډلونو په روزنه کې سخت تکیه کړې ده، د هغه څه چې د AI ماډلونه یې کولی شي سرحد ته فشار ورکړي. د قیمتونو سره چې د پانګوالو لخوا په پراخه کچه سبسایډي شوي، پیرودونکي هیڅ دلیل نه درلود چې پرته له خورا پرمختللي انتخاب څخه بل څه غوره کړي.
د ټوکن نرخونو لوړیدو او سبسایډي ورو کیدو سره ، کارونکي د لومړي ځل لپاره د لګښت فشار سره مخ دي. موږ نه پوهیږو چې ایا د نوي لګښت فشار به واقعیا د سوداګرۍ کارونکي کوچني ماډلونو ته واړوي. دوی کولی شي په اسانۍ سره د لږو تلیفونونو په کولو سره ، د لږ شرایطو په کارولو سره ، یا په ساده ډول د لږو ژمنو ګمارلو له لارې اقتصادي وده وکړي.
مګر که دا معلومه شي چې ډیری ګمارنې یوازې په کوچني ماډل کې هم پرمخ وړل کیدی شي، دا کولی شي د مخ پر ودې غوښتنې په اړه جدي خنډ رامینځته کړي - او د فرنټیر ماډل روزنې لګښت څنګه توجیه کولو په اړه نوې پوښتنې راپورته کړي.