دو ہفتے قبل، OpenAI نے کہا تھا کہ وہ روبوٹکس پروگرام کو دوبارہ شروع کرے گا جسے اس نے 2021 میں بند کر دیا تھا - یہ تازہ ترین اشارہ ہے کہ سب سے بڑی AI لیبز مشینوں کو جسمانی دنیا میں کام کرنا سکھانے کے لیے دوڑ رہی ہیں۔ لیکن قابل روبوٹس بنانے کے لیے ایسی چیز کی ضرورت ہوتی ہے جو AI انڈسٹری کے پاس ابھی تک نہیں ہے، جو کہ زبان کے ماڈلز کے لیے استعمال ہونے والے تربیتی ڈیٹا سے مماثل ہے۔ یہ فرق ایک نئی قسم کے بنیادی ڈھانچے کا کاروبار پیدا کر رہا ہے۔ LLMs کے برعکس جنہیں عوامی طور پر دستیاب متن کے وسیع سمندر پر تربیت دی گئی تھی، روبوٹس کو ایسے ڈیٹا کی ضرورت ہوتی ہے جو جسمانی تعامل کو پکڑتا ہو، اور اس قسم کا ڈیٹا بمشکل موجود ہوتا ہے۔ گیگ ورکرز کے ذریعے کیپچر کی گئی یوٹیوب ویڈیوز اور فوٹیج کم مخلص ہیں اور جسمانی دنیا سے ہم آہنگ ہونا مشکل ہے۔

یہ فرق ایک نئی قسم کے بنیادی ڈھانچے کا کاروبار پیدا کر رہا ہے۔ LLMs کے برعکس جنہیں عوامی طور پر دستیاب متن کے وسیع سمندر پر تربیت دی گئی تھی، روبوٹس کو ایسے ڈیٹا کی ضرورت ہوتی ہے جو جسمانی تعامل کو پکڑتا ہو، اور اس قسم کا ڈیٹا بمشکل موجود ہوتا ہے۔ گیگ ورکرز کے ذریعے کیپچر کی گئی یوٹیوب ویڈیوز اور فوٹیج کم مخلص ہیں اور جسمانی دنیا سے ہم آہنگ ہونا مشکل ہے۔

XDOF (تلفظ "ecks-doff")، جو آج اسٹیلتھ سے ابھرتا ہے، شرط لگا رہا ہے کہ AI میں اگلی بڑی رکاوٹ ماڈلز یا چپس نہیں ہے، بلکہ ڈیٹا فیڈ بیک لوپ کی ضرورت ہے جو روبوٹ کو جسمانی دنیا کے ساتھ بات چیت کرنے کا طریقہ سکھانے کے لیے درکار ہے۔

اسٹارٹ اپ کا مقصد ڈیٹا پائپ لائنز، کلیکشن ٹولز، اور تشریحی نظام بنانا ہے جو فرنٹیئر لیبز اور روبوٹکس کمپنیاں خود کو آسانی سے نہیں بنا سکتیں — اور اسے کرنے کے لیے Thrive Capital، Spark Capital، a16z، Lux اور WndrCo سے 70 ملین ڈالر اکٹھے کیے ہیں۔ شریک بانی اور سی ای او فلپ وو کا کہنا ہے کہ XDOF، جس کے تقریباً 60 ملازمین ہیں، پہلے ہی 20 صارفین کے ساتھ کام کر رہے ہیں جن میں کئی فرنٹیئر AI لیبز بھی شامل ہیں، لیکن ان کے نام نہیں بتا سکتے۔

وو نے کہا، "تمام اعلی لیبز روبوٹکس کو آگے بڑھانے کی کوشش کر رہی ہیں۔ "ہم نے پہلے ہی زبان کے ماڈل کی دوڑ میں تھوڑا سا پیچھے پڑنے کے کچھ نشیب و فراز دیکھے ہیں … آپ اس قسم کی صورتحال میں نہیں رہنا چاہتے جہاں آپ اس ٹیکنالوجی کو بہت دیر سے آگے بڑھاتے ہیں، اور ہر کوئی اس کشتی میں ہے جہاں جسمانی AI اگلی سرحد ہے۔"

وو یو سی برکلے میں پی ایچ ڈی کے طالب علم کے طور پر خود اس مسئلے سے دوچار ہوئے۔ اس کی توجہ روبوٹس کو بڑے پیمانے پر ڈیٹا سیٹس سے ہنر سیکھنے کے قابل بنانے پر تھی۔ بس ایک مسئلہ تھا۔

"ہمارے پاس کام کرنے کے لیے بڑے پیمانے پر ڈیٹا نہیں تھا،" اس نے TechCrunch کو بتایا۔ "یہ مرغی اور انڈے کا مسئلہ تھا - ہمیں پہلے حقیقت میں ڈیٹا اکٹھا کرنے کی ضرورت تھی اس سے پہلے کہ ہم یہ پوچھ سکیں کہ روبوٹکس کے لیے فاؤنڈیشن ماڈل کو کیسے تربیت دی جائے۔"

وو اور اس کے مستقبل کے XDOF کے شریک بانی اور CTO، Fred Shentu نے GELLO نامی ایک پروجیکٹ پر کام کیا، ایک کم لاگت والا ٹیلی آپریشن سسٹم جو ایک انسانی آپریٹر کو تربیتی ڈیٹا تیار کرنے کے لیے روبوٹک بازو کو کنٹرول کرنے دیتا ہے۔ وو نے کہا، "یہ روبوٹکس میں ایک بہت ہی بااثر کاغذ بن گیا، کیونکہ بہت سے لوگوں کی ایک جیسی ضروریات اور رکاوٹیں تھیں، اور بہت سے لوگوں نے ڈیٹا اکٹھا کرنے کے لیے اس قسم کے آلے کا فائدہ اٹھانا شروع کر دیا،" وو نے کہا۔

موقع کو دیکھتے ہوئے، وو، شینٹو، اور تیسرے شریک بانی اور چیف آپریٹنگ آفیسر نیمو جن نے اکتوبر 2024 میں XDOF کا آغاز کیا تاکہ روبوٹکس ماڈلز کی پِیروی کرنے والی کمپنیوں کو ڈیٹا ایکو سسٹم فراہم کیا جا سکے۔ اس بات کو ذہن میں رکھیں کہ صرف ڈیٹا کی فراہمی ہی ایک آخری کاروبار ہو سکتا ہے، کمپنی ڈیٹا کی صفائی، ٹولنگ، اور تشریح پر بھی توجہ مرکوز کر رہی ہے — روبوٹ ٹرینرز کے لیے خود کو تقویت دینے والا فیڈ بیک لوپ بنانا۔

نقطہ آغاز کے طور پر، کمپنی UC Berkeley کی AI ریسرچ لیب کے ساتھ شراکت کر رہی ہے تاکہ اسے جاری کیا جا سکے جو اس کے خیال میں اب تک جمع کیے گئے اعلیٰ معیار کے روبوٹ ٹریننگ ڈیٹا کا سب سے بڑا مجموعہ ہے، جسے ABC کہا جاتا ہے۔ اس میں روبوٹ کی ہیرا پھیری کے ڈیٹا کی 130000 چالیں، 300 گھنٹے کی تخروپن، اور 100 گھنٹے کی تشخیص شامل ہیں۔ اس طرح کا سکیلڈ پری ٹریننگ ڈیٹا اس سے پہلے اکیڈمی کے لیے کبھی دستیاب نہیں تھا۔

"ہم نے زبان، امیج جنریشن، اور دیگر شعبوں میں دیکھا ہے کہ جب ماڈلز اور ڈیٹا جاری کیا جاتا ہے، تو کمیونٹی ایسی چیزیں حاصل کرتی ہے جس کی آپ کو توقع نہیں ہوگی،" ڈیوڈ میک ایلسٹر، برکلے پی ایچ ڈی کے ایک طالب علم جنہوں نے ریلیز کو منظم کرنے میں مدد کی، نے ٹیک کرنچ کو بتایا۔

ٹیم پہلے ہی ڈیٹا کو روبوٹ کو بینچ مارک کاموں پر تربیت دینے کے لیے استعمال کر چکی ہے جیسے ٹی شرٹس کو فولڈنگ کرنا اور باکس کو چپٹا کرنا، یا ایئر پوڈز کو ان کے کیسز میں لوڈ کرنا۔

کمپنی ڈیٹا پرامڈ کے تین درجوں میں کام کرنے کا ارادہ رکھتی ہے۔ سب سے قیمتی درجہ ٹیلی آپریشن ڈیٹا ہے جو اصل روبوٹ تعینات کیا جا رہا ہے۔ اس کے بعد ٹیلی آپریٹڈ روبوٹ زیادہ عام ڈیٹا اکٹھا کرتے ہیں، جیسا کہ GELLO کے ساتھ ہوتا ہے۔ اور آخر کار روزمرہ کے کاموں کو انجام دینے والے انسانوں کے ذریعہ جمع کردہ "خودمختاری" ڈیٹا، جس کے لیے XDOF اپنے پہننے کے قابل سینسر بنانے کا ارادہ رکھتا ہے۔

وو نے کہا، "آپ کے کیمرہ کا انتخاب آپ کے ڈیٹا کے معیار کو متاثر کرنے والا ہے - جو آپ کے ہاتھ سے باخبر رہنے والے الگورتھم کی کارکردگی کو متاثر کرے گا۔" "اگر آپ شروع سے ہی ہارڈ ویئر کو اچھی طرح سے ڈیزائن نہیں کرتے ہیں، تو آپ جو ڈیٹا اکٹھا کرتے ہیں اس میں بہت خاص مسائل ہو سکتے ہیں جن کا آپ نے اندازہ نہیں لگایا تھا۔" کمپنی دنیا بھر میں ٹیلی آپریٹرز اور ایگو سینٹرک ڈیٹا آپریٹرز کی فوجوں کی خدمات حاصل کرنے اور تربیت دینے کا ارادہ رکھتی ہے - ایک محنتی ماڈل جو ایک واضح سوال اٹھاتا ہے: بڑی لیبز خود ڈیٹا پروڈکشن کا کام کیوں نہیں کر رہی ہیں؟

"آپ کو سینکڑوں روبوٹ کے ساتھ لاکھوں مربع فٹ کے گودام کی ضرورت ہے،" وو نے کہا۔ "آپ کو ان روبوٹس کو برقرار رکھنے، ان کے جسمانی پِیرامیٹرز کو کیلیبریٹ کرنے، اور آپریٹرز کو مناسب طریقے سے تربیت دینے کی ضرورت ہے۔"

یہ ایک ایسی تعمیر ہے جس کے لیے توجہ، سرمائے اور آپریشنل پیمانے کی ضرورت ہوتی ہے جسے زیادہ تر AI لیبز آؤٹ سورس کرنے کے بجائے آؤٹ سورس کریں گی - جس پر مارکیٹ XDOF شرط لگا رہی ہے۔

XDOF نام روبوٹکس کی اصطلاح "آزادی کی ڈگری" پر ایک ڈرامہ ہے جو ایک روبوٹ کی طرف سے کی جانے والی آزاد حرکات کی تعداد کو بیان کرتا ہے۔ آپ کے بازو، کندھے سے کلائی تک، آزادی کے سات درجے ہیں۔ ہیومنائڈ روبوٹکس کمپنی Figure.AI کے تازہ ترین روبوٹ میں 30 ہیں۔ کمپنی کے نام میں X اس کے عزائم کو حاصل کرتا ہے: "آزادی کی صوابدیدی ڈگری، آزادی کی لامحدود ڈگریاں،" وو کہتے ہیں۔