اربع تي AI startup Decart انڪشاف ڪيو Oasis 3، ان جو جديد انٽرايڪٽو ورلڊ ماڊل جيڪو حقيقي وقت ۾ فوٽو ريئلسٽڪ ڊرائيونگ ماحول پيدا ڪري سگهي ٿو، TechCrunch خاص طور تي سکيو آهي. ماڊل في الحال API ذريعي دستياب آهي.
شروعاتي طور تي خودمختيار گاڏين جي ڪمپنين کي ھدف ڪري رھيو آھي جيڪي ناياب ڊرائيونگ منظرنامي کي پيماني تي ٺاھڻ جي ضرورت آھي، ۽ روبوٽڪس ۽ ٻين جسماني AI ايپليڪيشنن ۾ وڌائڻ جو منصوبو آھي. پر وڏي شرط ڊولپرز تي آهي: پهرين ڏينهن کان API جي رسائي فراهم ڪندي، ڊيڪارٽ دنيا جي ماڊل جي چوڌاري هڪ ڊولپر ايڪو سسٽم ٺاهڻ جي ڪوشش ڪري رهيو آهي جيئن OpenAI ٻوليء جي ماڊل سان ڪيو.
"اها پهرين قابل استعمال دنيا جو ماڊل ٿيڻ وارو آهي جيڪو ماڻهو اصل ۾ پروگرام ڪري سگهن ٿا مٿي تي،" Dean Leitersdorf، Co-Founder ۽ CEO Decart، TechCrunch کي ٻڌايو. "منهنجو خيال آهي ته اتي هڪ مڪمل ڊولپر ڪميونٽي ٿيڻ وارو آهي جيڪو هن جي چوٽي تي ظاهر ٿئي ٿو."
شروعات ۾ ئي 100000 کان وڌيڪ ڊولپرز جي ڪميونٽي آهي، جن مان ڪيترائي پراڊڪٽس ٺاهي رهيا آهن ان جي حقيقي وقت جي وڊيو ماڊل لوسي جي مٿان، گهڻو ڪري اي ڪامرس ۽ لائيو اسٽريمنگ ۾. Oasis 3 انهي بنياد تي ٻڌل آهي ماڊل، ۽ اها نمائندگي ڪري ٿي ڪمپني جي زور کي جسماني AI ۾. رسائي جي قيمت $0.02 في سيڪنڊ تي آهي، ۽ انٽرپرائز جي قيمت استعمال جي ڪيسن تي منحصر آهي، ڊيڪارٽ چيو.
ڊيڪارٽ هڪ وڌندڙ ڀريل دنيا جي ماڊل ميدان ۾ راند ڪري رهيو آهي. گذريل سال، گوگل ريسرچ پريويو ۾ Genie 3 جاري ڪيو، Fei-Fei Li's World Labs شروع ڪيو ماربل تجارتي استعمال جي ڪيسن لاءِ، ۽ وڊيو جنريشن جي شروعاتون جهڙوڪ لوما ۽ رن وي پڻ پنهنجي فزڪس کان آگاهي واري وڊيو ماڊلز کي دنيا جي ماڊلز ۾ ترجمو ڪري رهيا آهن.
Oasis 3 جي رليز ڪجهه هفتا بعد آئي آهي جڏهن ٻه سال پراڻي ڊيڪارٽ $ 300 ملين ڊالر گڏ ڪيا ، جنهن جي پٺيان ليٽرسڊورف چوي ٿو ”اي ڪامرس ، لائيو اسٽريمنگ ۽ فزيڪل AI ۾ اسان جي ٺاهيل ماڊلز لاءِ وڏي طلب وڌي وئي“. گول ڊيڪارٽ جي قيمت کي تقريبن $4 بلين تائين وڌايو، ۽ اسٽريٽجڪ سيڙپڪارن جو هڪ سلسلو کڻي آيو جهڙوڪ ٽويوٽا، ايڊوب ۽ اي بي. اهي سڀئي ڪمپنيون امڪاني گراهڪ آهن، Leitersdorf چوي ٿو. Nvidia، هڪ موجوده سيڙپڪار، پڻ گول ۾ حصو ورتو.
Oasis 3 جي ڪنڊ ان جي ماڊلز ۽ لامحدود نسل جي صلاحيت جي فوٽو-ريئلزم ۾ آهي. اهو Decart جي حصي تي ڪجهه ڪارڪردگي جادوگري جي ڪري، ڪمپني جي ٻين مکيه پراڊڪٽ پاران طاقتور آهي: DOS (Decart Optimization Stack) سافٽ ويئر جيڪا ماڊلز کي Nvidia، Amazon ۽ Google هارڊويئر تي موثر طريقي سان هلائڻ جي اجازت ڏئي ٿي، ان جي ماڊل کي مقابلي جي ڀيٽ ۾ هلائڻ لاء تمام گهٽ قيمتي آهي.
"هي اسان جي پوري حقيقي وقت جي اسٽيڪ جي چوٽي تي ٺهيل آهي، جنهن کي اسان هارڊويئر تائين سڀني طريقي سان بهتر بڻايون ٿا،" Leitersdorf چيو. "تمام عمودي طور تي ضم ٿيڻ سان، اسان انهن ماڊلز کي هلائڻ لاء صنعت ۾ ڪنهن ٻئي جي ڀيٽ ۾ سستي قيمت جي آرڊر کان وڌيڪ هوندا آهيون."
شروعاتي ماڊلز ايترا ڪارآمد آهن، في ليٽرسڊورف، ته اهو پنهنجي زندگيءَ ۾ 100 ملين ڊالرن کان ”تمام گهٽ“ خرچ ڪري چڪو آهي.
Oasis 3 جسماني طور تي صحيح، گھڻ-ڪئميرا ماحول پيدا ڪري ٿو - ھڪڙو سامھون ۽ ٻه طرفو سامھون- ٽريننگ ۽ ٽيسٽنگ سسٽم لاءِ. ۽ محدود ڊيمو ۽ تحقيقي ڏيک پيش ڪرڻ بدران، ڊيڪارٽ ڊولپرز کي لامحدود منظرنامو پيدا ڪرڻ جي اجازت ڏئي ٿو.
ٻين ماڊلز جي مقابلي ۾ مون ڪوشش ڪئي آهي، جهڙوڪ گوگل جي جيني 3 يا ورلڊ ليبز جو ماربل، اواسيس 3 مون ڏٺو آهي هڪ واحد ٽيڪسٽ پرامپٽ مان سڀ کان وڌيڪ فوٽو ريئلسٽڪ ماحول فراهم ڪري ٿو. ۽ حقيقت اها آهي ته توهان انهن سان ڪلاڪن تائين لهه وچڙ ڪري سگهو ٿا ڪارڪردگي جي هڪ سطح جو مشورو ڏئي ٿو ته ڊيڪارٽ جي حریفن جي گهٽتائي ٿي سگهي ٿي.
پر توهان کي ايتري عرصي تائين هڪ دنيا پيدا ڪرڻ سان، ماڊل پڻ خاص طور تي خراب ٿي.
منهنجي جاچ ۾، مون محسوس ڪيو ته سسٽم مسلسل هڪ مضبوط شروعاتي منظر قائم ڪري سگهي ٿو جيڪو جلدي سان ملندو آهي، پر موضوعاتي سالميت تيزيء سان خراب ٿي وئي جيئن آئون دنيا ۾ منتقل ٿي ويو. مون ان کي چيو ته صبح جو نيو يارڪ شهر جي گهٽي ٺاهي، اهو ائين ڪيو، خوبصورتي سان. پر جيئن مون گڏ هلندي هلندي، ماحول نيو يارڪ جهڙو گهٽ ۽ ڪنهن به شهري، مغربي شهر جي معياري ورزن جهڙو نظر آيو.
جڏهن مون چوڌاري ڦرڻ جي ڪوشش ڪئي ۽ شروعاتي چونڪ ڏانهن موٽڻ جي ڪوشش ڪئي، اهو هليو ويو، هڪ مڪمل طور تي نئين ماحول سان تبديل ٿي ويو. انهي جي چوٽي تي، ڪنٽرول تمام جوابدار نه هوندا آهن، ۽ مان اڪثر ڪري ڪنٽرول وڃائي چڪو آهيان جتي ڪار هلي رهي هئي (ٻيهر، هڪ خرابي حصيداري ڪئي وئي جيڪا ٻين دنيا جي ماڊلز مان آزمائي چڪو آهيان). تجربو گهٽ محسوس ڪيو هڪ مربوط تخليق وانگر ۽ وڌيڪ هڪ خواب جهڙو، شعور جو بيحد وهڪرو جيڪو جلدي بيوقوف بڻجي ٿو. هڪ ٻيو مسئلو، جيڪو مون دنيا جي ٻين ماڊلز ۾ پڻ ڏٺو آهي، اهو آهي ته ڪار صرف ٻين ڪارن ذريعي ڊوڙندي، مطلب ته ماڊل ماحول ۾ فزڪس کي صحيح نموني سان ترتيب نٿو ڏئي. Leitersdorf ان کي سڏي ٿو "وڏي تحقيق جو مسئلو جنهن کي اسان هاڻي ٽوڙي رهيا آهيون،" ان کي ان حقيقت ڏانهن منسوب ڪري ٿو ته "حادثن جي مقابلي ۾ سٺي ڊرائيونگ تي تمام گهڻو ڊيٽا آهي."
انهي جو حصو جيڪو هن فزڪس جي مستقل مزاجي کي مشڪل بڻائي ٿو اهو بنيادي آهي ته هي عالمي ماڊل ڪيئن ڪم ڪري ٿو. Oasis 3 خود بخود رجعت پسند آهي، مطلب ته اهو هڪ وقت ۾ هڪ فريم ٺاهي ٿو، ۽ اهو واپس ڏسڻ ۾ اچي ٿو جيڪو اڳ ۾ پيدا ڪيو ويو اهو فيصلو ڪرڻ لاءِ ته اڳتي ڇا اچي. هي دنيا جي ڪيترن ئي ماڊلز جي هڪ اهم تعميراتي خصوصيت آهي، ۽ اهو پڻ هڪ ڪمپيوٽي-گھڻي آهي.
مستقل مزاجي کي برقرار رکڻ لاءِ، Leitersdorf جو چوڻ آهي ته ڊيڪارٽ ٽيم ڪم ڪري رهي آهي ماڊل جي ياداشت جي ڊگھائي کي بهتر ڪرڻ لاءِ.
"هر فريم جيڪو اسان ٺاهيندا آهيون تقريبن 8000 ٽوڪن آهي،" هن چيو. "في سيڪنڊ جي ڏهن فريم تي هي ٺاهي رهيو آهي - اهو آهي سوين هزارين ٽوڪن في سيڪنڊ. حوالن واري ونڊو تمام جلدي ڀرجي ٿي. اسان تحقيق ڪري رهيا آهيون ته ڪئين لکن کان وڌيڪ ٽوڪن کي محفوظ ڪرڻ لاءِ ڊگھي حوالي سان ڪيئن ڪجي، ۽ يادگيري کي گهٽ ٽوڪن ۾ ڪيئن دٻايو وڃي."
Leitersdorf جو خيال آهي ته مستقل مزاجي جو مسئلو جزوي طور ماڊل جي ايندڙ ورزن ۾ حل ٿي سگهي ٿو، جيڪو صارفين کي تصوير جي بجاءِ ماحول جي وڊيو جي بنياد تي دنيا ٺاهڻ شروع ڪرڻ جي اجازت ڏيندو. هن تسليم ڪيو ته دنيا جا ماڊل هڪ فيلڊ جي طور تي اڃا به ابتدائي آهن.
اڃا تائين، باني پنهنجي ٽيڪچ جي موجوده حدن تي گهٽ ڌيان ڏنو آهي ته ڇا ٿيندو جڏهن ڊولپرز ان تي پنهنجا هٿ حاصل ڪندا.
”اهو مون کي واپس وٺي ٿو LLMs جي شروعاتي ڏينهن ڏانهن، جڏهن OpenAI ماڊلز لاءِ API ايجاد ڪئي،“ هن چيو، هڪ ڊولپر ڪميونٽي جي اڀرڻ ڏانهن اشارو ڪندي جيڪا فيلڊ کي ترقي ڪري نئين استعمال جا ڪيس ڳولڻ ۽ تعمير ڪندي.
"جڏهن اسان ٽن مهينن ۾ ٻيهر ڳالهائينداسين، اسان وانگر هونداسين، 'هتي 100 ڊولپرز آهن جن سڀني کي Oasis سان 100 مختلف ايپليڪيشنون ٺاهيا آهن جيڪي اسان سڀني کي حيران ڪري ڇڏيو،'" هن چيو.