گوگل متعارف ڪرايو آهي DiffusionGemma، هڪ تجرباتي اوپن ماڊل جيڪو متن کي تيزيءَ سان تيار ڪرڻ لاءِ تيار ڪيو ويو آهي ڊفيوشن-بنياد واري طريقي جي بدران عام ٽوڪن-بائي-ٽوڪن طريقي جي بدران اڪثر وڏي ٻولي ماڊلز پاران استعمال ڪيل.

ماڊل Apache 2.0 لائسنس تحت جاري ڪيو ويو آهي. اهو ماهرن جي ماڊل جو هڪ 26B مرکب آهي، پر صرف 3.8B پيرا ميٽرز انفريشن دوران سرگرم آهن. گوگل جو چوڻ آهي ته هي DiffusionGemma کي اجازت ڏئي ٿو 18 GB جي VRAM جي حدن اندر هاءِ-آخر صارف GPUs تي جڏهن مقدار جي حساب سان.

ماڊل Gemma 4 خاندان ۽ گوگل جي Gemini Diffusion تحقيق تي ٺهيل آهي. گوگل چوي ٿو DiffusionGemma GPUs تي 4x تيز ٽيڪسٽ جنريشن تائين پهچائي سگھي ٿو، پر اھو اڃا تائين تجرباتي آھي ۽ اعليٰ معيار جي پيداواري ڪم لاءِ معياري گيما 4 ماڊلز کي تبديل ڪرڻ لاءِ نه آھي.

اڪثر ٻولي جا ماڊل ٽيڪسٽ ٺاهي کاٻي کان ساڄي تائين، هڪ وقت ۾ هڪ ٽوڪن. اهو ڪلائوڊ سسٽم ۾ سٺو ڪم ڪري ٿو جتي سرور ڪيترن ئي صارفن جي درخواستن کي گڏ ڪري سگھن ٿا، پر اهو مقامي GPUs کي گهٽ استعمال ڪري سگهي ٿو جڏهن هڪ وقت ۾ هڪ صارف جي خدمت ڪندي.

DiffusionGemma مختلف طريقي سان ڪم ڪري ٿو. اهو هر فارورڊ پاس سان متوازي طور تي 256 ٽوڪن ٺاهي ٿو، ماڊل کي اجازت ڏئي ٿو ته متن جي مڪمل بلاڪ کي هڪ ڀيرو ۾ مسودو ۽ ان کي ڪيترن ئي مرحلن تي بهتر.

گوگل جو چوڻ آهي ته هي طريقو ميموري بينڊوڊٿ کان ڪمپيوٽنگ ۾ رڪاوٽ کي تبديل ڪري ٿو، جيڪو وقف ٿيل GPUs تي رفتار کي بهتر ڪرڻ ۾ مدد ڪري ٿو. ماڊل ھڪڙي NVIDIA H100 تي 1000 ٽوڪن في سيڪنڊ کان وڌيڪ ۽ NVIDIA GeForce RTX 5090 تي 700 ٽوڪن في سيڪنڊ کان وڌيڪ ٺاھي سگھي ٿو.

DiffusionGemma جو مقصد محققن ۽ ڊولپرز جو آهي جيڪو رفتار سان حساس مقامي ورڪ فلوز تي ڪم ڪري رهيو آهي. انهن ۾ ان لائن ايڊيٽنگ، تيز رفتاري، غير لڪير ٽيڪسٽ جنريشن، ڪوڊ ڀرڻ، امينو اسيد جي ترتيب، ۽ رياضياتي گراف شامل آهن.

ماڊل ٻه طرفي ڌيان استعمال ڪري ٿو، مطلب ته ٺاهيل بلاڪ ۾ هر ٽوڪن ٻين سڀني ٽوڪن ۾ شرڪت ڪري سگهي ٿو. اهو ڪمن ۾ مدد ڪري ٿو جتي اڳ ۽ بعد ۾ پيداوار جا حصا هڪ ٻئي تي ڀاڙين ٿا.

اهو پڻ سپورٽ ڪري ٿو ٻيهر خود اصلاح. ماڊل مڪمل ٽيڪسٽ بلاڪ جو جائزو وٺي سگهي ٿو ۽ نسل جي دوران ان جي پنهنجي پيداوار کي بهتر ڪري سگهي ٿو.

بهرحال، گوگل چوي ٿو DiffusionGemma جي مجموعي پيداوار جي معيار معياري Gemma 4 کان گهٽ آهي ڇاڪاڻ ته اها رفتار ۽ متوازي ترتيب جي پيداوار کي ترجيح ڏئي ٿي. ايپليڪيشنن لاءِ جن کي بهترين پيداوار جي معيار جي ضرورت آهي، گوگل سفارش ڪري ٿو معياري Gemma 4 ماڊل.

گوگل جو چوڻ آهي ته DiffusionGemma جي رفتار جو فائدو مقامي ۽ گهٽ ڪرنسي انفرنس لاءِ مضبوط آهي.

هاء-QPS ڪلائوڊ سرونگ ۾، خودڪار طريقي سان ماڊل اڳ ۾ ئي استعمال ڪري سگھن ٿا بيچنگ هارڊويئر کي مڪمل طور تي چالو رکڻ لاء. انهن حالتن ۾، DiffusionGemma جي متوازي ڊيڪوڊنگ پيش ڪري ٿو ننڍا فائدا ۽ خدمت جي قيمت وڌائي سگھي ٿي.

تنهن ڪري ماڊل هڪ واحد ايڪليٽر تي گهٽ کان وچولي بيچ جي سائيز لاءِ بهتر آهي، خاص طور تي مقامي اوزارن ۽ AI ايپليڪيشنن لاءِ.

DiffusionGemma متن جي پيداوار لاءِ diffusion طرز جي عمل کي لاڳو ڪري ٿو.

ماڊل بي ترتيب واري جڳهه واري ٽوڪن جي ڪينواس سان شروع ٿئي ٿو. اهو پوءِ ڪيترن ئي پاسن کي ٺاهيندو آهي، صحيح ٽوڪن ۾ لاڪ ڪرڻ ۽ انهن کي استعمال ڪرڻ جي حوالي سان استعمال ڪندي باقي آئوٽ کي بهتر ڪرڻ لاءِ. اهو عمل جاري رهندو جيستائين متن پنهنجي آخري شڪل تائين پهچي.

گوگل چوي ٿو ته هي ماڊل کي اجازت ڏئي ٿو ته انهن نمونن جي حمايت ڪن جيڪي ترتيب وار ماڊلز لاءِ سخت آهن، جهڙوڪ پيچيده مارڪ ڊائون فارميٽنگ کي صحيح طور تي بند ڪرڻ يا اصل وقت ۾ ڪوڊ ٺاهڻ ۽ رينجر ڪرڻ.

گوگل چوي ٿو DiffusionGemma مخصوص ڪمن لاءِ ٺيڪ ٿي سگھي ٿو.

هڪ مثال ۾، سوڊوڪو کيڏڻ لاءِ Unsloth فائن ٽيونڊ DiffusionGemma. گوگل چوي ٿو اهو هڪ ڪم آهي جتي خودڪشي ڪندڙ ماڊل جدوجهد ڪري سگهن ٿا ڇو ته هر ٽوڪن مستقبل جي ٽوڪن تي ڀاڙي سگهي ٿو.

DiffusionGemma جي ٻه طرفي توجه انهي قسم جي ڪم کي آسان بڻائي ٿي ڇو ته ماڊل هڪ ڀيرو مڪمل ٽيڪسٽ بلاڪ تي غور ڪري سگهي ٿو.

ڊولپرز ڊائون لوڊ ڪري سگھن ٿا DiffusionGemma جي تجرباتي ماڊل وزن کي Hugging Face کان Apache 2.0 لائسنس تحت.

گوگل پڻ مهيا ڪري رهيو آهي هڪ ڊولپر گائيڊ ۽ هڪ بصري گائيڊ اهو بيان ڪري ٿو ته ڊفيوژن گيما ڪيئن ڪم ڪري ٿو.

ماڊل MLX، vLLM، ۽ Hugging Face Transformers ذريعي خدمت ڪري سگھجي ٿو. گوگل چوي ٿو vLLM انضمام Red Hat جي حمايت ڪئي وئي آهي.

فائن ٽيوننگ لاءِ، گوگل هيڪبل ڊفيوشن استعمال ڪندي هڪ ٽيوٽوريل جاري ڪري رهيو آهي، هڪ ماڊلر JAX ٽول باڪس. ڊولپرز انسلٿ ۽ NVIDIA NeMo سان فائن ٽيوننگ پڻ ڳولي سگھن ٿا.

llama.cpp لاءِ سرڪاري مدد پڻ رٿيل آهي.

گوگل چوي ٿو ته اهو NVIDIA سان گڏ ڪم ڪيو DiffusionGemma کي بهتر ڪرڻ لاءِ NVIDIA هارڊويئر تي.

ماڊل صارف جي GPUs لاءِ مقدار مطابق ڪيو ويو آهي جهڙوڪ GeForce RTX 5090 ۽ RTX 4090. اهو پڻ ترقي يافته NVFP4 ڪنلز سان Hopper ۽ Blackwell هارڊويئر استعمال ڪندي انٽرپرائز سسٽم کي سپورٽ ڪري ٿو. گوگل پڻ NVIDIA DGX Spark، DGX اسٽيشن، ۽ RTX PRO سسٽم لاءِ سپورٽ جو ذڪر ڪيو.

NVFP4 لاءِ اصلي سپورٽ، هڪ 4-bit فلوٽنگ پوائنٽ فارميٽ، اصل ماڊل جي درستي کي برقرار رکڻ دوران ڪمپيوٽي جي ذريعي کي بهتر ڪرڻ لاءِ ٺهيل آهي.

📢 جديد ٽيڪنالاجي ۽ ٽيلي ڪام جي خبرن، وڊيوز ۽ تجزين لاءِ هاڻي ئي شامل ٿيو پروپاڪستاني جي WhatsApp گروپ!

گوگل نيوز تي پروپاڪستاني کي فالو ڪريو ۽ تيزيءَ سان پنهنجي پسنديده مواد ذريعي اسڪرول ڪريو!

شيئرز