د AI سټارټ اپ Decart د چهارشنبه په ورځ د خپل وروستي متقابل نړیوال ماډل Oasis 3 پرانسته وکړه چې کولی شي په ریښتیني وخت کې د فوټوریاستیک موټر چلولو چاپیریال رامینځته کړي ، TechCrunch په ځانګړي ډول زده کړل. ماډل اوس مهال د API له لارې شتون لري.
پیل په پیل کې د خپلواکو موټرو شرکتونه په نښه کوي چې اړتیا لري په پیمانه د نادر موټر چلولو سناریو سمولو ته اړتیا ولري، او پالن لري چې روبوټکس او نورو فزیکي AI غوښتنلیکونو ته پراختیا ورکړي. مګر لوی شرط په پراختیا کونکو باندې دی: له لومړۍ ورځې څخه د API لاسرسي وړاندیز کولو سره ، ډیکارټ هڅه کوي د نړۍ ماډلونو شاوخوا د پراختیا کونکي ایکوسیستم رامینځته کړي لکه څنګه چې OpenAI د ژبې ماډلونو سره ترسره کړی.
"دا به د نړۍ لومړی د کارونې وړ ماډل وي چې خلک واقعیا په سر کې برنامه کولی شي ،" ډین لیټرسډورف ، د ډیکارټ شریک بنسټ ایښودونکی او سی ای او ټیک کرنچ ته وویل. "زه فکر کوم چې دلته به یوه ټوله پراختیا کونکي ټولنه وي چې د دې په سر کې راپورته کیږي."
سټارټ اپ دمخه د 100000 څخه ډیرو پراختیا کونکو ټولنه لري ، چې ډیری یې د خپل ریښتیني وخت ویډیو ماډل لوسي په سر کې محصولات رامینځته کوي ، په لویه کچه په ای کامرس او ژوندی جریان کې. Oasis 3 د دې بنسټ ماډل پراساس دی، او دا په فزیکي AI کې د شرکت فشار استازیتوب کوي. ډیکارټ وویل چې لاسرسی په هره ثانیه کې $ 0.02 قیمت لري، او د تصدۍ قیمت د کارونې په قضیو پورې اړه لري.
ډیکارټ د نړۍ په ډیریدونکي ډک شوي ماډل ډګر کې لوبیږي. پروسږکال، ګوګل د څیړنې په مخکتنه کې جین 3 خپور کړ، د Fei-Fei Li's World Labs د سوداګریزې کارونې قضیې لپاره ماربل پیل کړ، او د ویډیو تولید پیل کول لکه لوما او رن وے هم د دوی فزیک پوهه ویډیو ماډلونه د نړۍ ماډلونو ته ژباړي.
د Oasis 3 خپریدل څو اونۍ وروسته له هغې راځي چې دوه کلن ډیکارټ $ 300 ملیون ډالر راټول کړل ، کوم چې لیټرسډورف وايي "د هغه ماډلونو لپاره چې موږ جوړ کړي د لوی غوښتنې زیاتوالی" په ای کامرس ، ژوندی جریان او فزیکي AI کې تعقیب شو. دې پړاو د Decart ارزښت نږدې 4 ملیارد ډالرو ته لوړ کړ، او د ستراتیژیکو پانګوالو لړۍ یې لکه ټیوټا، Adobe او eBay راوړه. لیټرسډورف وايي، دا ټول شرکتونه احتمالي پیرودونکي دي. Nvidia، یو موجوده پانګه اچوونکی، هم په پړاو کې برخه اخیستې وه.
د Oasis 3 څنډه د دې ماډلونو عکس ریالیزم او د لامحدود نسل وړتیا کې پروت دی. دا د ډیکارټ په برخه کې د ځینې موثریت جادوګرۍ له امله دی ، چې د شرکت د نورو اصلي محصول لخوا پرمخ وړل کیږي: DOS (د ډیکارټ اصلاح کولو سټیک) سافټویر چې ماډلونو ته اجازه ورکوي چې په Nvidia، Amazon او ګوګل هارډویر کې په مؤثره توګه پرمخ بوځي، د دې ماډلونه د سیالانو په پرتله خورا ارزانه چلوي.
"دا زموږ د ټول ریښتیني وخت سټیک په سر کې جوړ شوی ، کوم چې موږ هارډویر ته ټولې لارې غوره کوو ،" لیټرسډورف وویل. "په عمودي توګه مدغم کیدو سره ، موږ کولی شو د دې ماډلونو چلولو لپاره په صنعت کې د بل هرچا په پرتله د ارزانه اندازې څخه ډیر ارزانه واوسو."
د سټارټ اپ ماډلونه دومره اغیزمن دي، د لیټرسډورف په وینا، چې دا د خپل ژوند په اوږدو کې د 100 ملیون ډالرو څخه ډیر "ډیر کم" سوځیدلی.
Oasis 3 د روزنې او ازموینې سیسټمونو لپاره په فزیکي توګه دقیق، څو کیمرې چاپیریال رامینځته کوي - یو مخکی مخ او دوه اړخ ته مخامخ. او د محدود ډیمو او څیړنې لیدونو وړاندیز کولو پرځای ، ډیکارټ پراختیا کونکو ته اجازه ورکوي چې په لامحدود ډول سناریوګانې رامینځته کړي.
د نورو ماډلونو په پرتله چې ما هڅه کړې، لکه د ګوګل جینی 3 یا د نړۍ لابراتوار ماربل، Oasis 3 د یو واحد متن پرامپټ څخه چې ما لیدلی دی خورا فوټوریاستیک چاپیریال وړاندې کوي. او دا حقیقت چې تاسو کولی شئ د دوی سره د ساعتونو لپاره اړیکه ونیسئ د موثریت کچه ښیي چې د ډیکارټ سیالان ممکن نه وي.
مګر تاسو ته اجازه درکوي چې د اوږدې مودې لپاره نړۍ رامینځته کړئ ، ماډل هم د پام وړ خرابیږي.
زما په ازموینه کې، ما وموندله چې سیسټم کولی شي په دوامداره توګه یو قوي ابتدايي صحنه جوړه کړي چې د پرامپټ سره سمون خوري، مګر د موضوع بشپړتیا په چټکۍ سره خرابه شوه کله چې زه د نړۍ له لارې حرکت کوم. ما ورته په سهار کې د نیویارک ښار سړک رامینځته کولو ته وهڅاوه ، دا یې په ښکلي ډول وکړ. مګر لکه څنګه چې زه په لاره روان وم، چاپیریال د نیویارک په څیر لږ ښکاري او د هر ښاري، لویدیځ ښار معیاري نسخه په څیر ښکاري.
کله چې ما هڅه وکړه چې شاته وګرځم او لومړني تقاطع ته بیرته راستون شوم ، دا ورک شو ، په بشپړ ډول نوي چاپیریال بدل شو. سربیره پردې ، کنټرولونه خورا ځواب ویونکي ندي ، او ما ډیری وختونه کنټرول له لاسه ورکړ چې موټر چیرې حرکت کوي (بیا ، د نړۍ د نورو ماډلونو لخوا شریک شوی نیمګړتیا چې ما ازمولې ده). تجربه د یو همغږي سمول په څیر لږ احساس کړه او ډیر د خوب په څیر ، د شعور بې ځایه شوي جریان چې په چټکۍ سره بې معنی وده کوي. بله مسله، چې ما د نړۍ په نورو موډلونو کې هم لیدلې، دا ده چې موټر به یوازې د نورو موټرو له لارې تیریږي، پدې معنی چې ماډل په چاپیریال کې د فزیک په سمه توګه تقلید نه کوي. لیټرسډورف دې ته "لویه څیړنه ستونزه" بولي چې موږ یې اوس په ټپه دروو، دا دې حقیقت ته منسوبوي چې "د حادثو په پرتله د ښه موټر چلولو په اړه خورا ډیر معلومات شتون لري."
د هغه څه یوه برخه چې د دې فزیک ثبات ستونزمن کوي د دې نړۍ ماډل څنګه کار کوي بنسټیز دی. Oasis 3 اتوماتیک ریګریسیو دی ، پدې معنی چې دا په یو وخت کې یو چوکاټ رامینځته کوي ، او بیرته هغه څه ته ګوري چې مخکې یې رامینځته کړي ترڅو پریکړه وکړي چې څه راځي. دا د نړۍ د ډیری ماډلونو کلیدي معمارۍ ځانګړتیا ده، او دا هم د محاسبې په کچه یو دی.
د دوام ساتلو لپاره، لیټرسډورف وايي د ډیکارټ ټیم د ماډل حافظې اوږدوالي ته وده ورکولو لپاره کار کوي.
هغه وویل: "هر چوکاټ چې موږ تولید کوو نږدې 8000 ټوکنونه دي." "دا په هره ثانیه کې په لسګونو چوکاټونو کې رامینځته کول - دا په هره ثانیه کې په سلګونو زره ټوکنونه دي. د شرایطو کړکۍ خورا ګړندي ډکیږي. موږ څیړنه کوو چې څنګه د ملیونونو نورو ټوکنونو ذخیره کولو لپاره اوږد شرایط ترسره کړو ، او څنګه حافظه په لږو ټوکنونو کې کمپریس کړو."
لیټرسډورف فکر کوي چې د دوام مسله ممکن د ماډل په راتلونکي نسخه کې په جزوي ډول حل شي ، کوم چې کاروونکو ته به اجازه ورکړي چې د عکس پرځای د چاپیریال ویډیو پراساس نړۍ رامینځته کړي. هغه ومنله چې د ساحې په توګه د نړۍ ماډلونه لا دمخه دي.
بیا هم، بنسټ ایښودونکی د هغه د ټیکنالوژۍ اوسني محدودیتونو باندې لږ تمرکز کوي په پرتله چې څه به پیښ شي کله چې پراختیا کونکي خپل لاسونه ورته ترلاسه کړي.
"دا زه بیرته د LLMs لومړیو ورځو ته ږدم ، کله چې OpenAI د ماډلونو لپاره API ایجاد کړ ،" هغه وویل ، د پراختیا کونکي ټولنې رامینځته کیدو ته په اشارې سره چې د کارونې نوي قضیې موندلو او رامینځته کولو سره یې ساحه پرمختللې.
هغه وویل: "کله چې موږ په دریو میاشتو کې بیا خبرې کوو، موږ به داسې یو، 'دلته 100 پراختیا کونکي دي چې ټولو د Oasis سره 100 مختلف غوښتنلیکونه جوړ کړي چې موږ ټول یې حیران کړل.