
Ang pagbuo ng imahe na pinapagana ng AI ay naging isa sa mga pinakanakikitang pagpapakita ng karera sa pagitan ng mga higanteng kompanya ng teknolohiya. ay nagpasya na gumawa ng isang hakbang na may malalim na pag-update ng Mga Larawan ng ChatGPT, ang pinagsamang sistema ng paglikha ng biswal nito, sa konteksto kung saan ang mga modelong tulad ng Nano Banana Pro ng Google ang nangingibabaw sa halos lahat ng usapan.
Sa paglulunsad na ito, nais ng kumpanya sa likod ng ChatGPT na ang tool nito ay lumampas sa pagiging isang simpleng chat add-on at gumana bilang isang ganap na tampok. isang tunay na pinagsamang malikhaing studio, mas mabilis, mas tumpak at may interface na dinisenyo mula sa simula upang gumana sa mga imahe sa halip na limitado sa teksto.
Bagong modelo ng GPT Image 1.5: bilis at katumpakan bilang mga tatak nito
Ang puso ng pag-update ay Larawan ng GPT 1.5Ang bagong pangunahing modelo ng OpenAI para sa mga imahe. Inaangkin ng kumpanya na maaari itong makabuo ng visual na nilalaman hanggang apat na beses na mas mabilis kaysa sa nakaraang bersyon, isang bagay na sa pagsasagawa ay lalong kapansin-pansin sa mga oras na peak hours at sa mga mobile device, kung saan dati ay hindi bihira na ang proseso ay maantala o matagal na tumatagal kapag nagpapalit ng mga application.
Bukod sa pagganap, ang pangunahing pagpapabuti ay nasa pagsubaybay sa instruksyon. Mas tumpak na nabibigyang-kahulugan ng sistema ang mga instruksyon. mga kumplikadong prompt at tumpak na mga ugnayang pang-espasyoupang ang mga kahilingan tulad ng pagpapalit lamang ng isang bagay, pagsasaayos ng ilaw, o pagbabago ng damit ng isang tao ay hindi na magdudulot ng mga hindi inaasahang pagbabago sa natitirang bahagi ng eksena.
Ipinaliwanag ng OpenAI na ang GPT Image 1.5 ay sinanay upang mapanatiling pare-pareho ang mahahalagang elemento ng imahe, tulad ng pagkakakilanlan ng mukha, pangkalahatang komposisyon, o paleta ng kulaykahit na matapos ang ilang sunod-sunod na pag-eedit. Ang puntong ito ay lalong mahalaga para sa propesyonal na paggamit, kung saan ang visual consistency ay hindi lamang kapritso, kundi isang kinakailangan.
Pag-edit ng spot at chain: baguhin lamang ang mahalaga
Isa sa mga aspeto kung saan nagkulang ang mga nakaraang modelo ay ang naka-target na pag-edit ng mga partikular na lugarAng pagpapalit ng sumbrero, pagsasaayos ng ilaw, o pagdaragdag ng elemento sa background ay maaaring magresulta sa pag-remix ng buong eksena. Direktang tinutugunan ng mga bagong ChatGPT Images ang problemang ito.
Ang modelo ay may kakayahang magdagdag, mag-alis, pagsamahin, paghaluin at ilipat ang posisyon ng mga elemento sa loob ng parehong imahe habang pinapanatiling matatag ang lahat ng iba pang mahahalagang bahagi. Sa pagsasagawa, nangangahulugan ito ng kakayahang humiling ng mga aksyon tulad ng: pagpapalit ng kulay ng isang kamiseta, pagbabago ng isang sumbrero, pagsasaayos ng isang karatula trapiko, o pagbabago ng isang trak tungo sa isang trak ng bumbero nang hindi binabago ang natitirang bahagi ng kapaligiran.
Pinatibay din ang pag-uugali sa mga tawag sa telepono mga edisyon ng kadenaHanggang ngayon, ang pangatlo o pang-apat na pagbabago ay karaniwang magiging sanhi ng ganap na "pag-imbento" ng modelo ng imahe. Gamit ang GPT Image 1.5, mas maaasahan ng tool na mapapanatili ang estilo, postura, at eksena, kaya maaari kang ulitin ang parehong base nang hindi kinakailangang magsimula sa simula sa bawat pagbabago.
Mga malikhaing pagbabago: mula selfie hanggang poster ng pelikula
Higit pa sa teknikal na katumpakan nito, itinutulak ng OpenAI ang mga Larawan ng ChatGPT sa natatanging malikhaing larangan. Pinapayagan ng sistema ang mga gumagamit na mag-upload ng kanilang sariling larawan at, sa isang medyo simpleng prompt, makuha ang imahe sa loob lamang ng ilang segundo. kapani-paniwalang mga binagong bersyonMula sa isang patalastas ng dekada 90 hanggang sa isang eksena sa Times Square sa kalagitnaan ng taglamig o isang lungsod sa Hapon na may cyberpunk aesthetic.
Ang modelo ay may kakayahang muling likhain mga partikular na istilo ng sining, tulad ng mga klasikong poster ng pelikula, mga ilustrasyon na istilong anime, o mga komposisyong mukhang makasaysayan, na nirerespeto ang mga pangunahing katangian ng orihinal na tao. Ang ideya ay "makikita" ng gumagamit ang kanilang mga sarili sa ibang-ibang konteksto, nang hindi nawawala ang pakiramdam na ito ay ang parehong tao.
Ang pamamaraang ito ay nakapagpapaalala sa mga iniaalok na ng mga modelong tulad ng Nano Banana, ngunit sinusubukan ng OpenAI na ibahin ang sarili nito sa pamamagitan ng pagtaya sa mas kontroladong mga pagbabagong konseptwalkung saan pinapanatili ng sistema ang esensya ng batayang larawan habang nagpapalit ng damit, kapaligiran, ilaw o panahon nang may malaking visual na pagkakaugnay-ugnay.
Nagpaalam na ang mga Larawan ng ChatGPT sa madilaw-dilaw na istilo at pinapahusay ang mga kumplikadong eksena
Sa loob ng mahabang panahon, medyo madaling matukoy kung ang isang imahe ay nilikha gamit ang mga naunang bersyon ng ChatGPT: nangingibabaw ang mga ito mainit na kulay, kremang pagtatapos, at isang tiyak na dilaw na kulay na nagsiwalat ng artipisyal na pinagmulan nito. Mga panloob na paghahambing na ipinakita ng OpenAI at mga independiyenteng pagsubok, kumpara sa mga alternatibo tulad ng Tagalikha ng Larawan ng BingParang naiwan na ang katangiang iyon.
Ang bagong modelo ay nag-aalok ng mas neutral at iba't ibang kulayDahil dito, ang mga imahe ay magmumukhang mas katulad ng mga konbensyonal na litrato maliban na lang kung tahasang hihilingin ng gumagamit ang iba sa prompt. Nakakatulong ito na ang mga imahe ay magmukhang hindi gaanong "may tatak" at mas kapaki-pakinabang sa mga konteksto kung saan ninanais ang realismo o pagsasama sa mga umiiral na materyal na potograpiya.
May mga pagpapabuti rin na ginawa sa representasyon ng mga eksena na may maraming maliliit na elementotulad ng mga pulutong o mga background na mayaman sa detalye. Ang mga mukha sa malalaking grupo ay mas naiiba na ngayon sa isa't isa, na may mas natural na mga postura at ekspresyon, at ang mga karaniwang kapintasan tulad ng mga bakas ng kamay, maliliit na hagod, o kakaibang mga pag-uulit ay nababawasan.
Binibigyang-daan ka ng ChatGPT Images na maglagay ng teksto sa loob ng mga larawan: tumalon sa mga poster, infographic at mockup
Ang pagbuo ng nababasang teksto sa loob ng isang imahe ay isa sa mga pangunahing hakbang ng generative AI. Inaangkin ng OpenAI na ang GPT Image 1.5 ay gumagawa ng isang mahalagang hakbang pasulong sa larangang ito, na may mas pare-parehong pag-render ng tipograpiya kaysa sa mga nakaraang bersyon.
Kayang hawakan ng modelo siksik at maliliit na bloke ng tekstoNagbubukas ito ng pinto sa paglikha ng mga poster, infographic, mockup ng pahina ng pahayagan, o mga disenyo na may mga talahanayan at mga format na uri ng markdown na may antas ng pagiging madaling basahin na, bagama't hindi perpekto, ay mas malapit sa isang bagay na magagamit nang walang masinsinang retouching.
Para sa mga nagtatrabaho sa marketing, edukasyon, e-commerce, o digital content, ang pagpapabuting ito ay nangangahulugan ng pagbabawas ng oras na ginugugol sa itama ang mga maling hugis na letra o mga salitang hindi kumpletoSa mga konteksto kung saan may pangangailangang gumawa ng mga biswal na materyales na may malinaw na mga mensahe na handa nang ilathala, ang katotohanan na ang modelo mismo ay bumubuo ng medyo malinis na teksto ay nagiging isang natatanging salik.
Isang bagong karanasan ng gumagamit: isang nakalaang seksyon ng Mga Larawan sa ChatGPT
Hindi lang sa modelo natatapos ang update; nakakaapekto rin ito sa kung paano ito ginagamit. Nagdagdag ang OpenAI ng bagong feature sa ChatGPT sidebar. isang partikular na seksyon na tinatawag na "Mga Larawan"Ito ay naaangkop sa parehong mobile app at sa web na bersyon. Ang layunin ay ihiwalay ang visual na karanasan mula sa tradisyonal na chat at gawing mas madali para sa mga ayaw mahirapan sa mga kumplikadong prompt na gamitin.
Mula sa bagong espasyong ito, matatagpuan ng gumagamit mga paunang natukoy na istilo, mga mungkahi sa uso, at mga template Para sa mga madalas na gawain tulad ng paglikha ng mga pagbati, pagpapanumbalik ng mga lumang larawan, paglipat sa pagitan ng iba't ibang istilo ng sining, o pagbuo ng mga baryasyon ng parehong produkto, binabawasan ng pamamaraang ito ang hadlang sa pagpasok para sa mga taong walang teknikal na karanasan.
Isa pang praktikal na aspeto ay ang seksyong Mga Larawan ay gumaganap bilang sentralisadong imbakan ng lahat ng biswal na likha ng gumagamit. Mula roon, mas madaling suriin ang mga nakaraang bersyon, ulitin ang isang istilo gamit ang bagong nilalaman, o ipagpatuloy ang pag-edit ng isang nabuo nang imahe, isang bagay na lalong kapaki-pakinabang sa mga tuluy-tuloy na daloy ng trabaho.
Mula sa nakakaakit na aksesorya hanggang sa biswal na kagamitan sa trabaho
Kinikilala mismo ng OpenAI na, hanggang ngayon, ang pagbuo ng imahe sa loob ng ChatGPT ay gumagana nang mas katulad ng isang mas kapansin-pansin sa loob ng isang interface na idinisenyo para sa teksto na nagsisilbing isang matibay na visual na kapaligiran sa trabaho. Sa pamamagitan ng update na ito, nilalayon ng kumpanya na gumawa ng isang kwalitatibong hakbang: paglipat mula sa mga "pagsubok" na imahe para sa social media patungo sa isang tool na magagamit sa mga proseso sa totoong mundo.
Ang pagpapabuti sa pagkakapare-pareho at pag-ulit ay may direktang epekto sa mga sektor tulad ng disenyo, marketing, e-commerce o brandingAng mga kompanyang kailangang iakma ang parehong konsepto ng malikhaing disenyo sa maraming format, subukan ang mga baryasyon ng isang produkto, o panatilihin ang pagkakapare-pareho ng mga logo at elemento ng korporasyon sa daan-daang piraso ay nakakatagpo ng malinaw na bentahe sa ganitong uri ng kontrol.
Mga malikhaing plataporma na tumatakbo sa Europa, tulad ng mga web editor at mga tool sa disenyo na nakabatay sa cloudIsinasama na nila ang mga modelong ito sa kanilang mga daloy ng trabaho. Sa aspetong ito, ang pangako ng OpenAI sa isang mas komprehensibong visual na kapaligiran ay maaaring maging angkop para sa parehong SME na naghahangad na mapabilis ang produksyon ng mga graphic na materyales at mga internal na pangkat ng komunikasyon sa malalaking korporasyon.
Pagkakaroon ng mga Larawan ng ChatGPT para sa mga user, negosyo, at developer
Sinimulan na ng OpenAI ang paglulunsad ng mga bagong ChatGPT Images para sa karamihan ng mga gumagamit ng platform, kabilang ang mga may libreng accountMaraming user ang nakakakita na ng notification kapag binuksan nila ang app na nag-aanyaya sa kanila na subukan ang function na image, at isang bagong nakalaang tab sa side menu para i-centralize ang paggamit nito.
Sa sektor ng negosyo, kinumpirma ng kumpanya na ang advanced access para sa mga Business at Enterprise account ay unti-unting ilulunsad, na may pokus sa mga integrasyon sa loob ng mga propesyonal na daloy ng trabahoPara sa mga organisasyong Europeo na gumagamit na ng ChatGPT para sa mga panloob na gawain, nangangahulugan ito ng kakayahang palawakin ang paggamit nito mula sa teksto hanggang sa graphic na materyal na nabuo sa ilalim ng parehong mga kredensyal.
Kasabay nito, ang GPT Image 1.5 ay makukuha sa pamamagitan ng OpenAI APINagbibigay-daan ito sa mga developer na isama ang mga kakayahan sa pagbuo at pag-edit ng imahe sa kanilang sariling mga aplikasyon. Sinasabi ng kumpanya na ang gastos sa pag-input at pag-output ng imahe ay humigit-kumulang 20% ​​na mas mababa kaysa sa nakaraang modelo, isang malaking bentahe para sa malalaking proyekto o serbisyo na nagpapatakbo sa maliit na kita.
Kompetisyon sa Nano Banana Pro at iba pang mga visual na modelo
Ang hakbang ng OpenAI ay dumating sa panahon ng matinding presyur sa kompetisyon. Itinulak ng Google Nano Banana Pro bilang isa sa mga nangungunang visual generative model, na isinama sa ecosystem nito ng mga malikhaing kagamitan at nakaugnay sa kanyang Pamilyang Gemini, na nagpalakas sa paggamit nito sa buong mundo.
Ang sitwasyong ito ay humantong sa pagtatatag ng [hindi malinaw] sa ilang mga kakumpitensyang serbisyo. mahigpit na mga limitasyon para sa mga libreng gumagamitHalimbawa, sa pamamagitan ng pagbabawas ng bilang ng mga imaheng maaaring mabuo bawat araw, bahagyang dahil sa mataas na demand. Sa kabaligtaran, tila tumataya ang OpenAI sa kombinasyon ng malawak na abot, mas mabilis na bilis, at mas pinong kapaligiran sa pag-eedit upang mapanatili at maakit ang mga gumagamit.
Samantala, ang ibang mga manlalaro tulad ng xAI kasama ang chatbot nitong Grok o iba't ibang mga espesyalista sa imahe ay nagtutulak para sa ang biswal na henerasyon ay nagiging isang sentral na harapan sa laban para sa atensyon ng mga gumagamit. Ang estratehiya ng OpenAI ay kinabibilangan ng pagsasama-sama ng ChatGPT bilang isang "all-in-one application," kung saan ang paghahanap, boses, teksto, mga imahe, at video ay magkakasamang nabubuhay sa iisang entry point.
Gamit ang bagong ChatGPT Images na ito, ang OpenAI ay gumagawa ng isang mahalagang hakbang tungo sa isang mas mature na visual toolIsang mas mabilis at mas tumpak na modelo, isang natatanging interface, at mga kakayahan sa pag-edit na malinaw na nakatuon sa totoong trabaho, kapwa sa personal at propesyonal na konteksto. Kailangan pang makita kung hanggang saan maisasama ang mga pagpapabuting ito sa pang-araw-araw na buhay ng mga gumagamit at negosyo sa Espanya at Europa, ngunit malinaw ang mensahe: ang imahe ay hindi na lamang isang masayang karagdagan sa chat, kundi naging isang pangunahing bahagi na ng ChatGPT ecosystem.
