ہم سب نے اپنے دوست کو یہ دکھانے کے لیے Google Maps پر Street View کھینچ لیا ہے کہ ہمارا بچپن کا گھر کیسا تھا، یا اس چھوٹے سے شخص کے آئیکن کو پِیرس کی سڑکوں پر چھوڑ دیا تاکہ یہ معلوم ہو سکے کہ آیا ہم نے کسی ٹھنڈے محلے میں ہوٹل بک کیا ہے۔ ایسا کرنے کے قابل ہونے کا تصور کریں، لیکن ایک زیادہ عمیق، متعامل انداز میں جو آپ کو واقعی گلی اور اس کے ماحول کی نقالی کرنے کی اجازت دیتا ہے، اور یہاں تک کہ موسم کو ایڈجسٹ کرنے یا "کل کے بعد کے دن" کے منظر نامے میں کیسا نظر آئے گا جیسے کام کرنے کی اجازت دیتا ہے۔
یہ گوگل کے تازہ ترین انضمام کے مقاصد میں سے ایک ہے۔ آج سے، Google DeepMind Street View کو Project Genie سے جوڑ رہا ہے، کمپنی کا عمومی مقصد والا عالمی ماڈل جو متنوع، متعامل ماحول پیدا کر سکتا ہے۔ نئی خصوصیت گوگل I/O ڈویلپر کانفرنس کے دوران شروع کی گئی۔
"یہ ایجنٹ [اور روبوٹکس] کے استعمال کے معاملے اور انسانوں کے ساتھ کھیلنے کے لیے دونوں کے لیے واقعی طاقتور ہے، اور یہ ہمیشہ جینی کا مقالہ رہا ہے،" جیک پارکر ہولڈر، ڈیپ مائنڈ کی اوپن اینڈڈنس ٹیم کے ایک ریسرچ سائنسدان نے ٹیک کرنچ کو بتایا۔
انہوں نے لندن میں ایک نئے روبوٹ کی تعیناتی کی مثال دی جو سورج کو کم ہی دیکھتا ہے۔ پارکر ہولڈر کا کہنا ہے کہ جینی ان نایاب مواقع کی تقلید کر سکتا ہے جب سورج وکٹورین ہاؤسنگ سے چمکتا ہے، لہذا جب ایسا ہوتا ہے تو کرنیں روبوٹ کو جھٹکا نہیں دیتی ہیں۔
پلیئر لوڈ ہو رہا ہے…
"اس کے ساتھ ہی، آپ کہہ سکتے ہیں، 'میں نیو یارک سٹی جا رہا ہوں، لیکن سال کے اس وقت نہیں،'" اس نے جاری رکھا۔ ’’یہ برفباری ہونے والی ہے۔ میں دیکھنا چاہتا ہوں کہ وہ بلاک برف میں کیسا لگتا ہے۔‘‘
گوگل 20 سالوں سے کیمروں والی کاروں اور "ٹریکر بیک پیک" والے افراد کے ذریعے Street View ڈیٹا اکٹھا کر رہا ہے۔ ٹیک دیو نے 110 ممالک اور سات براعظموں میں 280 بلین تصاویر کے شمال میں جمع کیے ہیں۔
جیک نے کہا، "Street View کے ساتھ، ہمارے پاس دنیا کی ایک بڑی مقدار کی تصاویر ہیں۔ "آپ تصور کر سکتے ہیں کہ حقیقی دنیا کی معلومات اور ڈیٹا کے اس بھرپور ذریعہ کو دنیا کی نقل کرنے کی صلاحیت کے ساتھ جوڑنا کتنا ممکنہ طور پر طاقتور ہے۔"
گوگل نے گزشتہ اگست میں تحقیقی پیش نظارہ کے لیے اپنا تازہ ترین عالمی ماڈل جنی 3 جاری کیا اور جنوری میں امریکہ میں گوگل اے آئی الٹرا سبسکرائبرز کے لیے ٹول تک رسائی کھول دی، جس سے صارفین ٹیکسٹ پرامپٹس یا امیجز سے انٹرایکٹو گیم ورلڈ تخلیق کر سکتے ہیں۔ مقصد تعلیمی تجربات، گیمنگ اور روبوٹکس کی تربیت کے لیے جنی کو استعمال کرنا ہے۔
Genie 3 پہلے سے ہی Waymo کے سمیلیٹروں میں سے ایک کو طاقتور بنانے میں مدد کر رہا ہے تاکہ اس کی خود سے چلنے والی کاروں کو "انتہائی نایاب واقعات" جیسے طوفانوں یا ہاتھیوں کے آرام دہ تصادم پر تربیت دی جا سکے۔ اس میں Street View ڈیٹا شامل کرنے سے Waymo کو دنیا بھر کے مزید شہروں میں لانچ کرنے کی تیاری میں مدد مل سکتی ہے۔
Waymo کا اپنا سمیلیٹر ہے جس پر اس نے 11 امریکی شہروں تک پیمانے پر انحصار کیا اور اپنے AI ڈرائیور کو مزید کئی شہروں میں ٹیسٹ کیا۔ پارکر ہولڈر کا کہنا ہے کہ جنی کے ساتھ فرق یہ ہے کہ یہ سب کار کے نقطہ نظر سے ہیں۔ Street View نہ صرف ایک حقیقی جگہ پر لنگر انداز دنیا کی نقل کرنے کی اجازت دیتا ہے، بلکہ نقطہ نظر کو دوسرے قسم کے ایجنٹوں، جیسے انسان یا روبوٹ کی طرف منتقل کرنے کی بھی اجازت دیتا ہے۔
گوگل آج سے ریاست ہائے متحدہ امریکہ میں کچھ الٹرا صارفین کے لیے جنی میں Street View لانچ کر رہا ہے، جس میں وقت کے ساتھ ساتھ بڑے پیمانے پر رسائی ہو رہی ہے۔ کمپنی کے مطابق، گلوبل الٹرا صارفین اگلے چند ہفتوں میں رسائی حاصل کر لیں گے۔
ڈیپ مائنڈ کے پروڈکٹ مینیجر ڈیاگو ریواس کے مطابق محققین کا مقصد اس نئی صلاحیت کو زیادہ سے زیادہ ہاتھوں میں دینا ہے۔ انہوں نے متنبہ کیا کہ خاص طور پر Street View اور عمومی طور پر Genie اب بھی ایک تجربہ ہے، لہذا درستگی کے لحاظ سے اس میں بہتری کے لیے بہت کچھ ہے۔
Google کی ٹیم نے مجھے دکھائے گئے نمونوں میں — جس میں میں رہتا تھا اس پڑوس کا پانی کے اندر نقلی نمونہ بھی شامل ہے — نتائج متاثر کن اور پہچانے جانے کے قابل ہیں، لیکن تصویری حقیقت کے بجائے ویڈیو گیم کا معیار۔ ماڈل بھی ابھی تک طبیعیات سے واقف نہیں ہیں، یعنی وہ ابھی تک وجہ اور اثر کو نہیں سمجھتے ہیں۔ مثال کے طور پر، برفیلے جوشوا کے درخت سے گزرنے والی ایک عورت کی نقل میں، وہ کیکٹی اور جھاڑیوں کے درمیان سے دوڑی۔
اس کا موازنہ گوگل کے امیج جنریٹر نینو کیلے سے کریں - جو اب انفوگرافکس میں کامل ٹیکسٹ تیار کر سکتا ہے — یا اس کا ویڈیو جنریٹر Veo — جو سمجھتا ہے کہ کاغذی کشتیاں پانی کے دھاروں پر چلتی ہیں، دھواں ہوا میں بکھر جاتا ہے، اور کپڑوں کی شکلوں پر پردہ پڑ جاتا ہے۔
طبیعیات کو ان ماڈلز میں سخت کوڈ نہیں کیا گیا ہے۔ وہ اسے غیر فعال مشاہدے کے ذریعے وقت کے ساتھ بدیہی طور پر سیکھتے ہیں، جیسا کہ ایک جاندار ہوتا ہے۔
پارکر ہولڈر نے کہا، "میرے خیال میں اس قسم کے ماڈل کے لیے، یہ درستگی اور معیار کے لحاظ سے ویڈیو سے چھ سے 12 ماہ پیچھے ہے، اس لیے مجھے لگتا ہے کہ یہ ایسی چیز ہے جسے ہم حل کریں گے۔" Google Maps کے ڈائریکٹر جوناتھن ہربرٹ، جنہوں نے 12 سال قبل Street View ٹیم میں بطور انٹرن آغاز کیا تھا، نے کہا کہ Genie ابھی تک کسی گلی کی وفادار تعمیر نو نہیں کر سکتا۔ اس کے خیال میں اصل پیش رفت AI کا مقامی تسلسل ہے۔ اگر آپ 360 ڈگری کا رخ کرتے ہیں تو، AI آپ کے پیچھے کے ماحول کو صحیح طریقے سے یاد رکھتا ہے اور اس کی نقل کرتا ہے۔ اس مقام سے، ماڈل اس کے اوپر ایک نیا ماحول بنا سکتا ہے۔
ہربرٹ نے کہا، "ہم نے طویل عرصے سے سوچا ہے کہ ہم Street View ڈیٹا کے اوپر دنیا کا بہترین اور امیر ترین ماڈل کیسے بنا سکتے ہیں۔" "یہ یقینی طور پر ہمارا ایک خیال رہا ہے کہ نقشہ جات کے ڈیٹا کو نئے طریقوں سے اور نئی قسم کی AI تحقیق کے لیے کافی عرصے سے استعمال کیا جائے۔"