دا دومره اسانه وه چې د انسان لخوا جوړ شوي او د AI لخوا رامینځته شوي عکس العمل ترمینځ توپیر وکړي - یوازې دوه کاله دمخه ، تاسو نشئ کولی د مکسیکو رستورانت لپاره د مینو رامینځته کولو لپاره د عکس ماډلونه وکاروئ پرته لدې چې د "انچویټا" ، "چویروس" ، "برټو" او "مارګارتاس" نوي پخلي خوندونه ایجاد کړئ. اوس ، کله چې زه د مکسیکو خواړو مینو لپاره د نوي ChatGPT عکسونو 2.0 ماډل څخه پوښتنه کوم ، دا یو څه رامینځته کوي چې سمدلاسه په رستورانت کې کارول کیدی شي پرته لدې چې پیرودونکي وګوري چې یو څه بند دی. (په هرصورت، د $ 13.50 قیمت ceviche کیدای شي ما د کب کیفیت تر پوښتنې لاندې راولي).

اوس ، کله چې زه د مکسیکو خواړو مینو لپاره د نوي ChatGPT عکسونو 2.0 ماډل څخه پوښتنه کوم ، دا یو څه رامینځته کوي چې سمدلاسه په رستورانت کې کارول کیدی شي پرته لدې چې پیرودونکي وګوري چې یو څه بند دی. (په هرصورت، د $ 13.50 قیمت ceviche کیدای شي ما د کب کیفیت تر پوښتنې لاندې راولي).

د پرتله کولو لپاره ، دلته هغه پایله ده چې ما دوه کاله دمخه د DALL-E 3 څخه ترلاسه کړې. (په هغه وخت کې، ChatGPT انځورونه نه دي تولید کړي):

د AI عکس جنراتورونو په تاریخي ډول د املا کولو لپاره مبارزه کړې ځکه چې دوی عموما د خپریدو ماډلونه کاروي ، کوم چې د شور څخه د عکسونو بیارغونې سره کار کوي.

د لیزان AI بنسټ ایښودونکی او سی ای او اسمیلاش ټیکا هډګو په 2024 کې ټیک کرنچ ته وویل: "د خپریدو موډل […] د ورکړل شوي ان پټ بیارغونه کوي."

څیړونکو له هغه وخت راهیسې د عکس تولید لپاره نور میکانیزمونه سپړلي، لکه د اتوماتیک ماډلونه، کوم چې د دې په اړه وړاندوینې کوي چې یو انځور باید څه ډول ښکاري او د LLM په څیر کار وکړي.

له بده مرغه، OpenAI پدې اونۍ کې په یوه مطبوعاتي کنفرانس کې یوې پوښتنې ته د ځواب ویلو څخه ډډه وکړه چې کوم ډول ماډل د ChatGPT عکسونو 2.0 ځواکمن کوي.

په هرصورت، شرکت دا تشریح کړه چې نوی ماډل د "فکر کولو وړتیا" لري، کوم چې دا وړتیا ورکوي چې ویب لټون وکړي، د یو پرامپټ څخه ډیری عکسونه جوړ کړي، او د هغې تخلیقات دوه ځله چیک کړي - دا د انځورونو 2.0 ته اجازه ورکوي چې په مختلفو اندازو کې د بازار موندنې شتمنۍ رامینځته کړي، په بیله بیا څو پینل شوي کامیک سټریپونه.

OpenAI دا هم وايي چې عکسونه په جاپاني، کوریايي، هندي او بنګالي ژبو کې د غیر لاتیني متن وړاندې کولو قوي پوهه لري. د ماډل پوهه د دسمبر په 2025 کې قطع کیږي ، کوم چې کولی شي پدې اغیزه وکړي چې دا کولی شي په دقیق ډول د وروستي خبرونو په شمول ځینې لارښوونې رامینځته کړي.

"انځورونه 2.0 د انځور جوړولو لپاره د ځانګړتیا او وفادارۍ بې ساري کچه راوړي. دا نه یوازې نور پیچلي انځورونه تصور کولی شي، مګر دا په حقیقت کې هغه لید په اغیزمنه توګه ژوند ته راوړي، د لارښوونو تعقیب کولو توان لري، غوښتل شوي توضیحات خوندي کړي، او ښه دانه عناصر وړاندې کړي چې ډیری وختونه د عکس ماډلونه ماتوي: کوچني متن، UI عناصر، سټراټیټ عناصر، سټراټیټ عناصر، سټراټیټ. محدودیتونه، ټول تر 2K ریزولوشن پورې، "OpenAI په یوه مطبوعاتي اعلامیه کې وویل.

د دې وړتیاو معنی دا ده چې د عکس تولید دومره ګړندی ندی لکه څنګه چې ChatGPT ته د پوښتنې ټایپ کول ، مګر د یو څه پیچلي رامینځته کول لکه ملټي پینل شوي کامیک لاهم یوازې څو دقیقې وخت نیسي.

ټول ChatGPT او کوډیکس کارونکي به وکولی شي د سه شنبې په ورځ د عکسونو 2.0 ته لاسرسی ومومي؛ تادیه شوي کارونکي به وکولی شي ډیر پرمختللي محصول تولید کړي. شرکت به د gpt-image-2 API هم چمتو کړي، د قیمت قیمت د محصول کیفیت او حل پورې اړه لري.