ګوګل د DiffusionGemma معرفي کړی، یو تجربوي خلاص ماډل چې د ډیری لوی ژبو ماډلونو لخوا کارول کیږي د معمول ټکن-با-ټوکن میتود پرځای د خپریدو پراساس طریقې په کارولو سره د متن ګړندي تولید لپاره ډیزاین شوی. ماډل د اپاچی 2.0 جواز لاندې خپور شوی. دا د متخصص ماډل 26B مخلوط دی، مګر یوازې د 3.8B پیرامیټرې د استخراج پرمهال فعال دي. ګوګل وايي چې دا ډیفیوژن ګیما ته اجازه ورکوي چې د لوړ پای مصرف کونکي GPUs کې د 18 GB VRAM محدودیتونو کې وګرځي کله چې مقدار کیږي.

ماډل د اپاچی 2.0 جواز لاندې خپور شوی. دا د متخصص ماډل 26B مخلوط دی، مګر یوازې د 3.8B پیرامیټرې د استخراج پرمهال فعال دي. ګوګل وايي چې دا ډیفیوژن ګیما ته اجازه ورکوي چې د لوړ پای مصرف کونکي GPUs کې د 18 GB VRAM محدودیتونو کې وګرځي کله چې مقدار کیږي.

ماډل د Gemma 4 کورنۍ او د ګوګل د جیمني ډیفیوژن څیړنې باندې جوړ شوی. ګوګل وايي چې DiffusionGemma کولی شي په GPUs کې تر 4x ګړندي متن تولید وړاندې کړي ، مګر دا لاهم تجربه لري او د لوړ کیفیت تولید کار لپاره د معیاري Gemma 4 ماډلونو ځای په ځای کولو لپاره ندي.

د ژبې ډیری ماډلونه له کیڼ څخه ښیې ته متن تولیدوي، په یو وخت کې یو نښه. دا په کلاوډ سیسټمونو کې ښه کار کوي چیرې چې سرور کولی شي د ډیری کاروونکو غوښتنې یوځای پروسس کړي ، مګر دا کولی شي ځایی GPUs پریږدي کله چې په یو وخت کې یو کارونکي ته خدمت وکړي.

DiffusionGemma په بل ډول کار کوي. دا د هر فارورډ پاس سره موازي 256 ټوکنونه رامینځته کوي ، ماډل ته اجازه ورکوي چې په یوځل کې د متن بشپړ بلاک مسوده کړي او په څو مرحلو کې یې پاک کړي.

ګوګل وايي چې دا طریقه د حافظې بینډ ویت څخه کمپیوټر ته خنډ بدلوي، کوم چې د وقف شوي GPUs سرعت ښه کولو کې مرسته کوي. ماډل کولی شي په یوه NVIDIA H100 کې په هره ثانیه کې له 1000 څخه ډیر ټوکنونه او په NVIDIA GeForce RTX 5090 کې په هر ثانیه کې له 700 څخه ډیر ټوکن تولید کړي.

DiffusionGemma موخه د څیړونکو او پراختیا کونکو لپاره ده چې د سرعت حساس محلي کاري فلو باندې کار کوي. په دې کې په لیکه کې ترمیم، چټک تکرار، غیر خطي متن تولید، د کوډ ډکول، د امینو اسید سلسلې، او ریاضي ګرافونه شامل دي.

ماډل دوه اړخیزه پاملرنه کاروي، پدې معنی چې په تولید شوي بلاک کې هر نښه کولی شي نورو ټولو ټوکونو ته حاضر شي. دا په دندو کې مرسته کوي چیرې چې د محصول دمخه او وروسته برخې په یو بل پورې اړه لري.

دا د تکراري ځان اصلاح ملاتړ هم کوي. ماډل کولی شي د بشپړ متن بلاک بیاکتنه وکړي او د نسل په جریان کې خپل محصول پاک کړي.

په هرصورت، ګوګل وايي د DiffusionGemma ټولیز محصول کیفیت د معیاري Gemma 4 څخه ټیټ دی ځکه چې دا سرعت او موازي ترتیب تولید ته لومړیتوب ورکوي. د غوښتنلیکونو لپاره چې د محصول غوره کیفیت ته اړتیا لري، ګوګل د معیاري Gemma 4 ماډل وړاندیز کوي.

ګوګل وايي د DiffusionGemma د سرعت ګټه د محلي او ټیټ توافقاتو لپاره خورا پیاوړې ده.

د لوړ QPS کلاوډ خدمت کولو کې ، اتوماتیک ماډلونه دمخه کولی شي د هارډویر بشپړ فعال ساتلو لپاره بیچینګ وکاروي. په دې قضیو کې، د DiffusionGemma موازي کوډ کول کوچنۍ ګټې وړاندې کوي او ممکن د خدماتو لګښتونه زیات کړي.

له همدې امله ماډل په یو واحد سرعت کونکي کې د ټیټ څخه تر مینځ بیچ اندازې لپاره غوره مناسب دی ، په ځانګړي توګه د ځایی وسیلو او متقابل AI غوښتنلیکونو لپاره.

DiffusionGemma د متن تولید لپاره د خپریدو سټایل پروسه پلي کوي.

ماډل د تصادفي ځای لرونکي ټوکنونو کینوس سره پیل کیږي. دا بیا ډیری پاسونه رامینځته کوي ، په سم ټوکنونو کې تالاشي کوي او د پاتې محصول پاکولو لپاره یې د شرایطو په توګه کاروي. پروسه تر هغه وخته دوام کوي چې متن خپل وروستي شکل ته ورسیږي.

ګوګل وايي چې دا ماډل ته اجازه ورکوي چې د نمونو ملاتړ وکړي چې د ترتیبي ماډلونو لپاره سخت وي، لکه د پیچلي مارک ډاون فارمیټ په سمه توګه بندول یا په نږدې ریښتیني وخت کې د کوډ تولید او وړاندې کول.

ګوګل وايي چې DiffusionGemma د ځانګړو دندو لپاره ښه تنظیم کیدی شي.

په یوه مثال کې، انسلوت د سوډوکو لوبولو لپاره ډیفیوژن ګیما ښه ټیون کړی. ګوګل وايي چې دا یو کار دی چیرې چې د اتوماتیک ماډلونه مبارزه کولی شي ځکه چې هر نښه کولی شي په راتلونکي ټوکن پورې اړه ولري.

د ډیفیوژن ګیما دوه اړخیزه پاملرنه دا ډول کار اسانه کوي ځکه چې ماډل کولی شي په یوځل کې بشپړ متن بلاک په پام کې ونیسي.

پراختیا کونکي کولی شي د اپاچي 2.0 جواز لاندې د هګینګ مخ څخه د DiffusionGemma تجربوي ماډل وزنونه ډاونلوډ کړي.

ګوګل د پراختیا کونکي لارښود او یو بصری لارښود هم چمتو کوي چې تشریح کوي چې څنګه DiffusionGemma کار کوي.

ماډل د MLX، vLLM، او هګینګ مخ ټرانسفارمرونو له لارې خدمت کیدی شي. ګوګل وايي چې د vLLM ادغام د Red Hat لخوا ملاتړ کیږي.

د ښه ټیوننګ لپاره ، ګوګل د هیک ایبل ډیفیوژن په کارولو سره ټیوټوریل خپروي ، د ماډلر JAX اوزار بکس. پراختیا کونکي کولی شي د Unsloth او NVIDIA NeMo سره سم ټیوننګ هم وپلټي.

د llama.cpp رسمي ملاتړ هم پالن شوی دی.

ګوګل وايي چې دا د NVIDIA سره کار کړی ترڅو د NVIDIA هارډویر کې DiffusionGemma اصلاح کړي.

ماډل د مصرف کونکو GPUs لکه GeForce RTX 5090 او RTX 4090 لپاره مقدار شوی دی. دا د پرمختللي NVFP4 کرنلونو سره د Hopper او Blackwell هارډویر په کارولو سره د تصدۍ سیسټمونو ملاتړ هم کوي. ګوګل د NVIDIA DGX سپارک، DGX سټیشن، او RTX PRO سیسټمونو لپاره ملاتړ هم یادونه وکړه.

د NVFP4 لپاره اصلي ملاتړ، د 4-بټ فلوټینګ پوائنټ بڼه، ډیزاین شوی ترڅو د کمپیوټري ټرپوټ ښه کړي پداسې حال کې چې دقت اصلي ماډل ته نږدې ساتل کیږي.

📢 د وروستي ټیک او ټیلیکام خبرونو، ویډیوګانو او تحلیلونو لپاره همدا اوس د پروپاکستاني واټساپ ګروپ سره یوځای شئ!

په ګوګل نیوز کې پروپاکستاني تعقیب کړئ او د خپلې خوښې مینځپانګې ګړندي سکرول کړئ!

ونډې