AI ویڈیو جنریشن سٹارٹ اپ رن وے میں عام سیلیکون ویلی کا پیڈیگری نہیں ہے۔ اسٹینفورڈ کے کوئی بانی نہیں، گوگل کے سابق بانی نہیں، کوئی نو فگر سیڈ راؤنڈ نہیں جس نے انہیں آمدنی کو نظر انداز کرنے کا وقت دیا ہو۔ اس کے تین بانی — دو چلی سے، ایک یونان سے — نے NYU کے Tisch سکول آف دی آرٹس میں ملاقات کی اور نیویارک میں کمپنی بنائی۔

رن وے بھی ہو سکتا ہے، اس پر منحصر ہے کہ آپ کس سے پوچھتے ہیں، آج کی سب سے زیادہ نتیجہ خیز AI کمپنیوں میں سے ایک۔ اس وجہ سے نہیں کہ اس نے کیا بنایا ہے، بلکہ اس کی وجہ سے جو وہ آگے بنانے کی کوشش کر رہا ہے۔

پچھلے کئی سالوں سے، AI انڈسٹری نے بڑی حد تک اس بنیاد پر کام کیا ہے کہ ذہانت زبان میں رہتی ہے۔ OpenAI کے ChatGPT اور Anthropic's Claude جیسے بڑے زبان کے ماڈل اس شرط کی عکاسی کرتے ہیں۔

رن وے، دوسرے حریفوں کے ساتھ، ایک مختلف بنا رہا ہے۔ اس کے بانیوں کا خیال ہے کہ AI ذہانت کی اگلی شکل متن سے نہیں بنائی جائے گی، بلکہ ویڈیو اور عالمی ماڈلز سے جو یہ سیکھتے ہیں کہ دنیا کیسے کام کرتی ہے، نہ کہ انسان اسے کیسے بیان کرتے ہیں۔ یہ فرق علمی لگتا ہے۔ اس کے مضمرات نہیں ہیں۔

رن وے کے شریک بانی اور شریک سی ای او Anastasis Germanidis نے کہا کہ دنیا کے مشاہداتی ڈیٹا پر براہ راست ماڈلز کی تربیت AI کی اگلی سرحد ہے۔ ان کا کہنا ہے کہ جو کمپنیاں پہلے وہاں پہنچیں گی، وہ زبان کو مکمل کرنے والی نہیں ہوں گی۔

یونین اسکوائر کے قریب رن وے کے گھریلو سورج کی روشنی سے بھرے ہیڈ کوارٹر سے جرمنیڈیس نے ٹیک کرنچ کو بتایا کہ "ہم بنیادی طور پر حقیقت کی اپنی سمجھ کے پابند ہیں۔"

"زبان کے ماڈلز کو پورے انٹرنیٹ پر، میسج بورڈز اور سوشل میڈیا پر، نصابی کتابوں پر تربیت دی جاتی ہے - موجودہ انسانی علم کو کشید کرنے کے لیے،" جرمنیڈیس نے جاری رکھا۔ "لیکن اس سے آگے جانے کے لیے، ہمیں کم متعصب ڈیٹا کا فائدہ اٹھانے کی ضرورت ہے۔"

2018 میں قائم کیا گیا، رن وے نے ویڈیو جنریشن ماڈلز پر اپنی ساکھ بنائی — بشمول اس کے جدید ترین Gen-4.5 — اور AI ٹولز جو لوگوں کو ٹیکسٹ پرامپٹس کو قابل تدوین، سنیما مواد میں تبدیل کرنے دیتے ہیں۔

آج، Runway کی ٹیکنالوجی فلم سازوں اور اشتہاری ایجنسیوں کے لیے پروڈکشن ورک فلو کو طاقت دیتی ہے، اور کمپنی نے Lionsgate اور AMC نیٹ ورکس جیسے بڑے میڈیا پلیئرز کے ساتھ معاہدے کیے ہیں۔ یہاں تک کہ اس کے ٹولز کو فلموں میں بھی استعمال کیا گیا ہے جیسے کہ "Everything Everywhere All At One."

رن وے کی قیمت اب $5.3 بلین ہے اور، اس کے ایک بانیوں کے مطابق، 2026 کی دوسری سہ ماہی میں سالانہ بار بار ہونے والی آمدنی میں $40 ملین کا اضافہ ہوا۔

اگر رن وے کی شرط یہ ہے کہ ویڈیو جنریشن دنیا کے ماڈلز کا راستہ ہے، تو نتیجہ ہالی ووڈ سے لے کر منشیات کی دریافت تک محسوس ہوگا۔ اگر ایسا نہیں ہوتا ہے تو، رن وے کو زیادہ گہرے جیب والے حریفوں سے آگے نکل جانے کا خطرہ ہے — ان میں گوگل چیف۔

پچھلے چھ مہینوں کے اندر، سٹارٹ اپ نے اپنے منصوبے کو عملی جامہ پہنایا اور ویڈیو جنریشن سے آگے بڑھایا، دسمبر میں اپنا پہلا عالمی ماڈل لانچ کیا، اس سال ایک اور لانچ کرنے کا منصوبہ ہے۔ (ورلڈ ماڈلز اے آئی سسٹمز ہیں جو ماحول کو اچھی طرح سے نقل کرتے ہیں تاکہ یہ اندازہ لگایا جا سکے کہ وہ کیسے برتاؤ کریں گے۔)

رن وے فزکس سے آگاہ ویڈیو ماڈلز کو عالمی ماڈلز میں تبدیل کرنے کے لیے اکیلا نہیں ہے، جس میں انٹرایکٹو تفریح، گیمنگ، اور روبوٹکس ٹریننگ میں قریب المدت استعمال کے معاملات شامل ہیں۔ سٹارٹ اپس لوما اور ورلڈ لیبز ایک ہی سمت میں ہیں، اور گوگل نے اپنے جنی ورلڈ ماڈل کو اسی سمت میں اشارہ کیا ہے۔

ہر کوئی ایک ہی چیز کے کچھ ورژن کے بعد ہے: AI جو انسانیت کے مشکل ترین مسائل کو حل کرتا ہے۔ یہ Runway کے اصل پروڈکٹ سے بہت دور ہے، لیکن یہ ٹیکنالوجی میں ابھرتی ہوئی صلاحیتوں اور بانیوں دونوں کا نتیجہ ہے جن کی پِیروی کرنے کا امکان تھا کہ وہ کہاں لے گیا۔

اپنے حصے کے لیے، جرمنیڈیس عالمی ماڈلز کو سائنسی انفراسٹرکچر کے طور پر دیکھتے ہیں۔ جتنے زیادہ حسی ڈیٹا اور مشاہدات پر آپ کسی ایک ماڈل کو تربیت دیتے ہیں، آپ کائنات کے کام کرنے والے ڈیجیٹل جڑواں کے اتنے ہی قریب پہنچ جاتے ہیں — جس پر آپ کسی بھی لیب سے زیادہ تیزی سے تجربات چلا سکتے ہیں۔ انہوں نے بتایا کہ سائنسی عمل کا زیادہ تر صرف نتائج کا انتظار کر رہا ہے۔ اگر آپ اس انتظار کو سکیڑ سکتے ہیں، تو آپ خود ترقی کو سکیڑ سکتے ہیں۔

جرمنیڈیس نے کہا، "اگر ہم انسانی سائنسدانوں سے بہتر سائنسدان بنا سکتے ہیں، تو ہم کائنات کو سمجھنے اور مسائل کو کیسے حل کرتے ہیں اس میں پیشرفت کو تیز کر سکتے ہیں۔"

جرمنیڈیس کو ایتھنز میں 11 سال کی عمر میں پروگرامنگ سے پیار ہو گیا اور وہ 18 سال کی عمر میں نیورو سائنس اور فلم کی تعلیم حاصل کرنے کے لیے امریکہ آیا۔ اس نے کمپیوٹر سائنس کی طرف رجوع کیا، کئی سلیکن ویلی ٹیک فرموں میں کام کرنے سے پہلے یہ فیصلہ کرنے سے پہلے کہ اس کے پاس کافی ثقافت ہے۔ شریک سی ای او کرسٹوبل ویلنزوئلا، جو سینٹیاگو میں پیدا ہوئے اور پلے بڑھے، انہوں نے فلم اور پھر سافٹ ویئر میں کام کرنے سے پہلے انڈرگریجویٹ کے طور پر معاشیات کی تعلیم حاصل کی۔ سینٹیاگو کے ایک اور باشندے، چیف انوویشن آفیسر الیجینڈرو ماتالا اورٹیز نے اشتہارات کی تعلیم حاصل کی اور ایک ڈیزائن فرم چلائی۔ تینوں کی ملاقات 2016 میں NYU کے ITP (انٹرایکٹو کمیونیکیشن پروگرام) میں شرکت کے دوران ہوئی تھی، جو کہ ایک گریجویٹ پروگرام ہے جسے ویلنزوئلا نے "انجینئروں کے لیے آرٹ اسکول" کے طور پر بیان کیا ہے۔

ماتمالا-اورٹیز کے مطابق، شریک بانیوں نے اپنی زندگی کے بعض موڑ پر فلم ساز بننے کی خواہش ظاہر کی تھی۔ تو رن وے نے ایک سادہ مشن کے ساتھ آغاز کیا: کیا ہم ہر ایک کو فلم ساز بنانے کے لیے AI کا استعمال کر سکتے ہیں؟

فروری 2023 میں اپنا پہلا ویڈیو جنریشن ماڈل ریلیز کرنے کے بعد - جو آج رن وے کے مقابلے میں حیرت انگیز طور پر غیر متاثر کن ہے - اس مشن میں اس طرح تیار ہوا: کیا ہم سب کو ایک بہترین فلم ساز بنا سکتے ہیں، Matamala-Ortiz کے مطابق۔

اس کے لیے ٹیم کو اس کی طرف بڑھنے کی ضرورت تھی جو آج ہے۔ کمپنی کے نیویارک، لندن، سان فرانسسکو، سیئٹل، تل ابیب اور حال ہی میں ٹوکیو میں دفاتر میں پھیلے ہوئے 155 کارکن ہیں۔ "لیکن اس سارے عمل کے دوران، ہم نے سیکھا کہ یہ ماڈل سمجھ سکتے ہیں کہ دنیا کیسے کام کرتی ہے، اور اگر آپ ان کی پیمائش کریں تو یہ بہت سی دوسری مختلف چیزوں کے لیے کارآمد ثابت ہو سکتے ہیں،" انہوں نے مزید کہا۔

روبوٹکس، منشیات کی دریافت، اور آب و ہوا کی ماڈلنگ جیسی چیزیں - اس قسم کے مسائل جو کئی دہائیوں سے محققین کو پریشان کر رہے ہیں۔ پچھلے سال، رن وے نے ایک روبوٹکس یونٹ شروع کیا جس کے بارے میں جرمنڈیس کا کہنا ہے کہ پہلے ہی حقیقی دنیا کی جانچ اور تعیناتی کا نتیجہ نکل چکا ہے۔

Germanidis، دوسروں کی طرح، بہت سے مختلف طریقوں - متن، ویڈیو، آواز، اور دیگر سینسرز پر ایک واحد ماڈل کی تربیت کی طرف بڑھتے ہوئے میدان کو دیکھتا ہے - اور سوچتا ہے کہ مرکب اثر نقطہ ہے۔

رن وے کی ٹکنالوجی کے لیے اس کا اپنا مون شاٹ ہدف، کافی وقت اور وسائل کے پیش نظر، حیاتیاتی دنیا کے ماڈلز اور اینٹی ایجنگ ریسرچ ہے۔

آیا رن وے اپنے ویڈیو کے غلبے کو عالمی ماڈلز میں لے جا سکتا ہے، یہ طے نہیں ہے، اور مقابلہ آس پاس کا انتظار نہیں کر رہا ہے۔ رن وے AI ویڈیو جنریشن کے لیے سب سے پہلے میں شامل تھا، لیکن عالمی ماڈلز گہری جیب والے اور معزز حریفوں کے ساتھ ایک مختلف دوڑ ہیں۔ گوگل، سابق میٹا چیف سائنسدان یان لیکون، AI کی 'گاڈ مدر' Fei-Fei Li، اور سٹارٹ اپس کا بڑھتا ہوا میدان سب ایک ہی مقصد کا تعاقب کر رہے ہیں۔

اے آئی سکلز بینچ مارکنگ کمپنی ورکرا کے سی ای او اور سٹینفورڈ کے ایک لیکچرر کیان کتانفوروش نے نشاندہی کی کہ ابھی تک کسی نے بھی ویڈیو انٹیلی جنس اور عمومی استدلال کے درمیان عالمی ماڈلز کے ذریعے چھلانگ ثابت نہیں کی ہے، لیکن اس کا مطلب یہ نہیں ہے کہ یہ ناممکن ہے۔ انہوں نے کہا کہ اگر رن وے اپنی عالمی ماڈل کی شرط کو حقیقت میں بدلنا چاہتا ہے، تو اسے وسائل جمع کرنا جاری رکھنے کی ضرورت ہوگی - ان میں کمپیوٹ چیف۔

Runway CoreWeave اور Nvidia کے ساتھ ڈیل کرتا ہے، لیکن اس بات کی تصدیق نہیں کرے گا کہ آیا اس کے پاس کلسٹر تک رسائی ہے - جس قسم کی گارنٹی شدہ، بڑے پیمانے پر کمپیوٹ کی تربیت فرنٹیئر ماڈلز کی ضرورت ہوتی ہے۔

"آپ کلسٹر کے بغیر ایک بنیادی ماڈل کیسے بنائیں گے؟" کاتنفروش نے پوچھا۔ "مجھے نہیں لگتا کہ کوئی ایسا کر سکتا ہے۔"

رن وے نے آج تک $860 ملین اکٹھے کیے ہیں، جس میں فروری میں AMD Ventures اور Nvidia جیسے اسٹریٹجک پارٹنرز سے $315 ملین راؤنڈ بھی شامل ہے۔ پچ بک کے مطابق، یہ تقریباً اپنے انتہائی قریبی حریفوں، لوما اے آئی اور ورلڈ لیبز کے مطابق ہے، جنہوں نے بالترتیب $900 ملین اور $1.29 بلین اکٹھے کیے ہیں۔

لیکن رن وے اوپن اے آئی جیسے عہدہ داروں کے خلاف بھی جا رہا ہے، جس نے فی سی ای او سیم آلٹ مین، اور ٹیک بیہیمتھ گوگل، جس کی بنیادی کمپنی الفابیٹ کی مالیت 4.86 ٹریلین ڈالر ہے، تقریباً 175 بلین ڈالر اکٹھے کیے ہیں۔ گوگل رن وے کا سب سے بڑا خطرہ ہے۔ کمپنی کا Veo ماڈل رن وے کے ویڈیو جنریشن کے کاروبار سے براہ راست مقابلہ کرتا ہے، جبکہ اس کا جنی ورلڈ ماڈل اسی طویل مدتی علاقے کو نشانہ بناتا ہے جس کی طرف رن وے دوڑ رہا ہے۔

Katanforoosh نے OpenAI میں سر ہلایا، جس نے مارچ میں اپنے ویڈیو پلیٹ فارم سورا کو تقریباً $1 ملین روزانہ حسابی اخراجات میں جلانے کے بعد بند کر دیا تھا جس میں کچھ اندازوں کے مطابق بمشکل $2.1 ملین آمدنی تھی۔ اس کا نقطہ: صرف وسائل ہی بقا کی ضمانت نہیں دیتے۔ وہ رن وے کے لیے بھی اس کی ضمانت نہیں دیتے ہیں۔

Katanforoosh رن وے آف نہیں لکھ رہا ہے۔ انہوں نے AI آڈیو سٹارٹ اپ ElevenLabs کی طرف اشارہ کیا، جس نے اپنے اپنے معیارات پر OpenAI اور Google کو پیچھے چھوڑ دیا ہے، باوجود اس کے کہ ان میں سے کسی کے وسائل اور نسب کی کمی ہے۔ ان کا کہنا ہے کہ رن وے اسی طرح کی پلے بک کی پِیروی کر سکتا ہے۔

رن وے کے بانیوں سے موازنہ ضائع نہیں ہوا ہے۔ ویلنزوئلا کا کہنا ہے کہ اسٹارٹ اپ میں بے ایریا کی "معیاری کاری" کی کمی انہیں ایک برتری فراہم کرتی ہے۔ اس کا کہنا ہے کہ نہ صرف ان کے پاس سوچ کا تنوع ہے، لیکن سلیکن ویلی کے تعلقات کے بغیر، انہیں زیادہ کھردرا ہونا پڑا، جنگ کے سینے کی کمی کے باعث ان کے بہت سے ساتھیوں کی رسائی اس تک ہوتی ہے کہ وہ ابتدائی آمدنی پیدا کرنے کی ضرورت سے دور رہتے۔ اور رن وے کے چیف آپریٹنگ آفیسر مشیل کوون کے مطابق، کمپنی زیادہ فنڈز اکٹھا کرنے کے لیے جلدی میں نہیں ہے، یہاں تک کہ کمپیوٹ کے مطالبات پیمانے کے ساتھ بڑھ رہے ہیں۔

کمپاؤنڈ کے منیجنگ پارٹنر، ابتدائی سرمایہ کار مائیکل ڈیمپسی نے TechCrunch کو بتایا، "ان کے پس منظر نے انہیں جلدی ہونے، اکثر صحیح ہونے، اور ناقابل یقین حد تک تیزی سے آگے بڑھنے والی ثقافت کی تعمیر کی طرف راغب کیا ہے۔"

ویلنزوئلا کے لیے، وہ ثقافت اس سے شروع ہوتی ہے کہ وہ دنیا کو کس طرح دیکھتا ہے۔ وہ اپنے پاس جتنا بھی فارغ وقت ہوتا ہے — زیادہ نہیں، ایک شریک سی ای او اور نئے والد کے طور پر — کتابیں پڑھنے میں صرف کرتا ہے، بشمول چلی کے شاعر نیکنور پارا، جسے وہ پابلو نیرودا کے مخالف کے طور پر بیان کرتے ہیں: کم رسمی، کم علمی، یہ خیال رکھتے ہیں کہ شاعری اصولوں کی بجائے لوگوں کی ہے۔

ویلنزوئلا نے کہا کہ "قواعد صرف اصول ہیں جو انہوں نے ایجاد کیے ہیں۔" "یہ ایک محرک قوت ہے کہ ہم رن وے پر کیسے کام کرتے ہیں۔ وہ کہتے ہیں کہ سلیکون ویلی یہاں ہے اور یہیں پر اسٹارٹ اپس ہیں۔ کیوں؟ یہ صرف اصول بنائے گئے ہیں۔ ان سب کو صاف کریں اور دوبارہ شروع کریں۔"