
OpenAI ay gumawa ng isa pang turno sa estratehiya nito sa artificial intelligence sa paglulunsad ng GPT-5.4Ang modelong ito ay hindi lamang nangangako ng mas maraming computing power at mas mahusay na mga marka sa mga synthetic benchmark, kundi kumakatawan din sa isang malinaw na hakbang tungo sa automation ng mga totoong gawain sa mundo. Inihaharap ng kumpanya ang sistemang ito bilang ang pinaka-may kakayahan at mahusay na modelo nito sa kasalukuyan, na nakatuon sa mga propesyonal na kapaligiran, mahahabang gawain, at mga ahente na may kakayahang gumana na parang sila ay isang taong nakaupo sa isang computer.
Ang anunsyo ay dumating din sa isang maselang panahon para sa kumpanya ni Sam Altman, na nalugmok sa isang krisis sa reputasyon na nauugnay sa mga kasunduan nito sa Kagawaran ng Depensa ng Estados Unidos at mga kampanyang boycott tulad ng #QuitGPT. Ang pagbubunyag ng GPT-5.4, ilang araw lamang matapos GPT-5.3 InstantIto ay gumaganap bilang parehong teknikal at pampulitikang hakbang: paggamit ng teknolohikal na kakayahan habang sinusubukang mabawi ang tiwala ng mga gumagamit at pangunahing kliyente.
Dalawang variant para sa magkaibang profile: GPT-5.4 Thinking at GPT-5.4 Pro
Inilabas ng OpenAI ang GPT-5.4 sa dalawang pangunahing bersyon. Sa isang banda, GPT-5.4 Pag-iisip, available sa mga bayad na plano ng ChatGPT (Plus, Team at Pro), na nakatuon sa malalim at maraming yugtong pangangatwiranIpinapakita ng modelong ito sa gumagamit ang isang preview kung paano lalapit ang gawain, na nagbibigay-daan sa kanila na makialam sa kalagitnaan ng tugon upang i-redirect ang mga tagubilin nang hindi kinakailangang magsimula sa simula. Ang kakayahang ito na "putulin at i-redirect ang pangangatwiran," na tinatawag ng OpenAI na kakayahang magmanehoIto ay dinisenyo para sa mga kumplikadong problema kung saan nais ng gumagamit na magkaroon ng higit na kontrol sa proseso.
Sa kabilang banda, lumalabas na GPT-5.4 ProAng variant na ito ay naglalayong sa malalaking negosyo at mga pag-unlad kung saan ang patuloy na pagganap ay pinakamahalaga. masinsinang mga gawain at kumplikadong daloy ng trabahona may espesyal na pokus sa mga ahente na nagtatrabaho nang matagal na panahon, nagpoproseso ng maraming dokumento, at kailangang gumawa ng magkakasunod na desisyon. Sa API, ang parehong bersyon ay maaaring gamitin bilang mga engine para sa mga pasadyang produkto, na isinasama rin sa code-oriented platform, ang kahalili ng Codex.
Isang AI na nagpapatakbo ng kompyuter tulad ng isang taong gumagamit.
Ang tampok na lumilikha ng pinakamaraming balita ay ang GPT-5.4 ang unang pangkalahatang-gamit na modelo ng OpenAI na may mga kakayahan sa paggamit ng katutubong computerGinagamit ng kompanya ang terminong "paggamit ng kompyuter" upang tumukoy sa isang paraan kung saan ang sistema ay hindi limitado sa pagbuo ng teksto, kundi sa halip Binibigyang-kahulugan niya ang nakikita niya sa screen (sa pamamagitan ng pagkuha at panonood na may mataas na resolusyon) at naglalabas ng mga aksyon ng mouse at keyboard upang makumpleto ang mga gawain.
Sa pagsasagawa, pinapayagan tayo nito na isaalang-alang ang mga senaryo na hanggang kamakailan ay parang pang-araw-araw na science fiction: paghiling sa AI na magbukas ng mga email, mag-download ng mga invoice, kumuha ng mahahalagang datos at i-paste ito sa isang spreadsheet, o mag-navigate sa iba't ibang mga aplikasyon sa negosyo upang punan ang mga form, mag-query sa mga database, o bumuo ng mga ulat. Ayon sa mga panloob na benchmark, sa pagsubok Na-verify ng OSWorldna sumusukat nang eksakto sa kakayahang pangasiwaan ang isang desktop environment, nakakamit ng GPT-5.4 ang isang 75% na antas ng tagumpay, sa ibabaw ng 47,3% ng GPT-5.2 at gayundin sa karaniwang pagganap ng tao, na itinakda sa 72,4%.
Ang mga ganitong uri ng kasanayan ay lubos na akma sa uso patungo sa AI na nakabatay sa ahenteAng mga kagamitang tulad ng OpenClaw agent, na idinisenyo upang "kontrolin" ang computer ng gumagamit upang i-automate ang mga paulit-ulit na gawain, ay direktang nakikinabang mula sa isang modelo na paunang na-configure upang bigyang-kahulugan ang screen at isagawa ang kumpletong pagkakasunud-sunod ng mga aksyon. Para sa mga kumpanyang Europeo na sumusubok sa mga ahente sa mga departamento ng administrasyon, pananalapi, o teknikal na suporta, malaki ang pagkakaiba sa pagitan ng isang chatbot na tumutugon lamang at isang modelo na aktwal na kumikilos.
Context window para sa hanggang isang milyong token
Isa pang pangunahing tampok ng GPT-5.4 ay ang kapasidad nito sa panandaliang memorya. Sa API at sa integrasyon nito sa Codex, sinusuportahan ng modelo ang mga window ng konteksto na hanggang isang milyong tokenHigit pa sa doble nito ang operating memory na nauugnay sa GPT-5.2, na humigit-kumulang 400.000 token, at kumakatawan sa isang mahalagang hakbang para sa mga gumagamit ng napakaraming impormasyon: mga kontrata ng daan-daang pahina, malalaking repositoryo ng code, mga database ng customer, o mga taunang ulat sa pananalapi.
Para sa mga kompanya at law firm sa Europa, na sanay sa pagharap sa malawakang regulasyon, mula sa mga regulasyon sa pagbabangko hanggang sa mga dokumentasyon ng pagsunod tulad ng RGPDAng pinalawak na kontekstong ito ay nagbibigay-daan para sa pagproseso ng buong hanay ng mga dokumento nang hindi kinakailangang artipisyal na hatiin ang mga ito. Ang direktang bunga ay Mas kaunting konteksto ang nawawala, nababawasan ang mga pagkakamali ng pagkukulang, at mas napapanatili ang pagkakaugnay-ugnay. sa mga gawaing nangangailangan ng pagsunod sa mga tiyak na tagubilin sa pamamagitan ng maraming hakbang.
Bukod sa memorya, ipinakikilala ng GPT-5.4 ang inilarawan ng ilang sanggunian bilang isang paraan ng "matinding pangangatwiran"Ang pamamaraang ito ay nagbibigay-daan para sa mas malaking paggamit ng lakas sa pag-compute sa mga kumplikadong tanong, na nagsasagawa ng mga prosesong maaaring tumagal nang ilang oras sa halip na ilang segundo. Hindi lamang ito tungkol sa mabilis na pagtugon, kundi tungkol sa kakayahang upang mapanatili ang isang mas matagal na pagsusuri na may mas malalim at pare-parehongIto ay lalong mahalaga para sa mga consultancy, auditor, o mga pangkat ng pananaliksik na nagpapatakbo sa Europa na may mga pangmatagalang proyekto.
Paghahanap ng Kagamitan at kahusayan sa paggamit ng mga kagamitan
Para sa mga developer na gumagamit ng API, isa sa mga pinaka-praktikal na bagong tampok ay Paghahanap ng KagamitanHanggang ngayon, kailangan pa ring matanggap ng mga modelo ang kahulugan ng lahat ng magagamit na tool sa konteksto, na lubos na nagpapataas ng pagkonsumo ng token sa mga sistemang mayaman sa feature. Gamit ang Tool Search, nagagawa ng GPT-5.4 na dynamic na paghahanap para sa tool na kailangan mo sa lahat ng oras, na kumukunsulta lamang sa mahahalagang impormasyon.
Sa mga pagsubok na may 250 MCP Atlas benchmark task, gamit ang 36 na iba't ibang tool server, nakamit ng ganitong uri ng dynamic access bawasan ang kabuuang pagkonsumo ng token ng humigit-kumulang 47%habang pinapanatili ang parehong antas ng katumpakan. Para sa mga kompanyang Europeo na nagdidisenyo ng mga platform ng ahente na may dose-dosenang mga microservice, mula sa mga sistema ng pagsingil hanggang sa mga panloob na CRM at ERP, ang pagpapabuting ito ay isinasalin sa Mas mababang gastos sa pagpapatakbo at mas mabilis na oras ng pagtugonnang hindi isinasakripisyo ang pagiging kumplikado ng mga daloy ng trabaho.
Propesyonal na pagganap: mula sa opisina hanggang sa spreadsheet
Higit pa sa mga teknikal na balita, ang GPT-5.4 ay tahasang idinisenyo para sa mga gawain ng propesyonal na kaalamanSa pagsusulit GDPval, na sumusukat sa kakayahan ng mga ahente ng AI na makagawa ng totoong trabaho sa 44 na iba't ibang trabaho, ang bagong modelo tumutugma o nalalampasan ang mga propesyonal na tao sa 83% ng mga paghahambingAng mga ganitong uri ng gawain ay mula sa paghahanda ng mga presentasyon sa negosyo hanggang sa pangunahing pagsusuri sa pananalapi o pagbalangkas ng mga legal na dokumento.
Partikular na binibigyang-diin ng OpenAI ang mga pagpapabuti sa paggamit ng mga spreadsheet at presentasyon. Sa isang panloob na benchmark sa pagmomodelo ng pananalapi, nakakamit ng GPT-5.4 ang isang 87,3% na iskor, sa harap ng 68,4% ng GPT-5.2Para sa mga bangko, kompanya ng seguro, o mga kompanya ng fintech sa Europa na humahawak ng mga kumplikadong modelo sa Excel o mga katumbas na tool, ang pagkakaibang ito ay maaaring magmarka ng pagtalon sa pagitan ng isang support tool at isang assistant na may kakayahang gampanan ang mga gawain ng isang junior analyst na may limitadong pangangasiwa.
Sa larangan ng mga presentasyon, mas gusto ng mga taong tagasuri ang mga 68% ng mga pagkakataong ang mga slide ay nabuo gamit ang GPT-5.4 Kung ikukumpara sa nauna nito, nag-aalok ito ng mga makabuluhang pagpapabuti sa parehong estetika at biswal na pagkakaiba-iba. Ang mga ganitong uri ng pagpapahusay ay perpektong angkop sa pang-araw-araw na gawain ng mga pangkat ng benta, marketing, at pagkonsulta sa Espanya, kung saan ang paghahanda ng isang malinaw at maayos na istrukturang presentasyon ay maaaring gumugol ng maraming oras ng trabaho.
Mas kaunting mga error, mas maaasahan sa mahahabang sagot
Isa sa mga karaniwang kritisismo sa mga nakaraang modelo ay ang kanilang tendensiyang "maghalusinasyon," ibig sabihin, gumawa ng mga datos o paghaluin ang mga mapagkukunan nang hindi maaasahan. Inaangkin ng OpenAI na ang GPT-5.4 ay 33% na mas malamang na gumawa ng mga maling pahayag na ang GPT-5.2, at ang kumpletong mga tugon nito ay mayroon na 18% mas malamang na maglaman ng mga errorAng mga datos na ito, bagama't hango sa mga panloob na pagsusuri, ay nagmumungkahi na ang AI ay mas angkop para sa mga regulated na sektor tulad ng... pinansyal o kalusugankung saan ang anumang maling impormasyon ay maaaring magdulot ng malubhang problema.
Ang kombinasyon ng mas malawak na konteksto, mas malawak na paraan ng pangangatwiran, at ang kakayahang maputol ang proseso sa kalagitnaan ng proseso upang itama ang direksyon nito ay nakakatulong sa mas mataas na pagiging maaasahan. Para sa isang law firm sa Madrid o isang consultancy sa Brussels, ang kakayahang suriin ang "plano ng pag-atake" ng modelo bago ito matapos sa pagbuo ng isang kumpletong ulat ay nagbibigay-daan. upang matukoy ang mga paglihis o hindi magandang pamamaraan sa orasnang hindi nagsasayang ng mga mapagkukunan o oras sa susunod na pagsusuri.
Programming at pagganap sa mga teknikal na benchmark
Sa larangan ng pagbuo ng software, minana ng GPT-5.4 ang mga kakayahan ng GPT-5.3-Codex At, ayon sa OpenAI, natatapatan o nahihigitan nito ang mga ito sa mga mahihirap na pagsubok tulad ng SWE-Bench Pro na may mas mababang latency. Hindi kahanga-hanga ang mga pagpapabuti sa mga marka (pinag-uusapan natin ang katamtamang pagtaas sa porsyento ng mga nalutas na insidente), ngunit ang kombinasyon ng code, pangangatwiran, at paggamit ng katutubong computer sa iisang modelo ay nagpapakita ng isang kawili-wiling senaryo: mga ahente na Nagbabasa sila ng mga repositoryo ng code, binabago ang mga file, at sinusubukan ang mga pagbabago sa mga kapaligirang totoong-buhay.lahat sa loob ng iisang daloy.
Para sa mga European developer na nagsasama ng GPT-5.4 sa pamamagitan ng API, marahil ang susi ay hindi ang eksaktong benchmark figure, kundi ang katotohanan na nilulutas ng modelo ang mga katulad na gawain gamit ang mas kaunting mga tokenIginiit ng OpenAI na ang GPT-5.4 ang pinaka-epektibong sistema ng pangangatwiran nito sa token sa kasalukuyan, ibig sabihin ay maaari nitong maabot ang parehong konklusyon nang may mas kaunting "mga panloob na salita." Para sa mga kumpanyang nagbabayad bawat token, ang kahusayang iyon ay maaaring higit pa sa mabawi ang tumaas na bayad bawat milyong token.
Pag-browse sa web at mga kumplikadong paghahanap
Isa pang aspeto kung saan ang GPT-5.4 ay nagpapabuti kumpara sa mga nauna nito ay ang pakikipag-ugnayan sa web. Sa mga benchmark tulad ng BrowseCompNakatuon sa mga gawain sa paghahanap at pananaliksik online, ang bagong modelo ay umaabot sa humigit-kumulang 82,7%, sa harap ng 65,8% ng GPT-5.2Pinaninindigan ng OpenAI na ang GPT-5.4 ay lalong mahusay sa... tukuyin ang mga kaugnay na impormasyon sa malalaking dami ng datos, ang tinatawag nilang mga query na "karayom ​​sa tumpok ng dayami".
Para sa mga mamamahayag sa Europa, mga analyst sa merkado, at mga mananaliksik, ang kakayahang ito ay nangangahulugan ng kakayahang italaga ang ilan sa mga gawain sa pagsusuri ng impormasyon sa AI, habang pinapanatili ang isang tungkulin sa pangangasiwa at pangwakas na pag-verify. Maaaring subaybayan ng modelo ang maraming mapagkukunan, piliin ang mga tila pinaka-maaasahan, at mag-alok ng isang makatwirang buod, na binabawasan ang oras na ginugugol sa paulit-ulit na paghahanap.
Mas mataas na presyo, ngunit mas mataas din ang kahusayan
Kung pag-uusapan ang presyo, ang GPT-5.4 ay may mas mataas na presyo kumpara sa GPT-5.2. Ang karaniwang modelo ay nagkakahalaga ng $2,50 bawat milyong input token at $15 bawat milyong output token, kumpara sa $1,75 at $14, ayon sa pagkakabanggit, para sa GPT-5.2. Ang bersyon GPT-5.4 Pro Ito ay mas mahal nang malaki: $30 bawat milyong input token at $180 bawat milyong output token, ang mga bilang ay malinaw na nakatuon sa mga proyektong pangnegosyo na may mataas na idinagdag na halaga.
Ipinagtatanggol ng OpenAI ang mga bayaring ito sa pamamagitan ng pag-asa sa mas mataas na kahusayan sa pagkonsumo ng token at sa pagbabawas ng error. Kung ang isang modelo ay nangangailangan ng mas kaunting mga token upang maisagawa ang parehong gawain at nakakagawa rin ng mas kaunting mga error na nangangailangan ng manu-manong pagwawasto, ang kabuuang gastos sa bawat proyekto ay maaaring maging mas mababa kahit na may mas mataas na presyo ng token. Para sa malalaking account sa Europa, mula sa mga sistematikong bangko hanggang sa mga pangunahing grupo ng industriya, ang debate ay hindi na gaanong tungkol sa nominal na presyo bawat milyong token, kundi tungkol sa pangkalahatang gastos ng pag-automate ng mga proseso na may garantisadong mga resulta.
Isang paglulunsad sa gitna ng kontrobersiya at matinding kompetisyon
Hindi basta-basta lumilitaw ang GPT-5.4. Dumarating ito sa gitna ng isang napakalapit na kompetisyon sa Anthropic at GoogleAt sa gitna ng kaguluhan sa media tungkol sa mga kasunduan ng OpenAI sa Pentagon, habang ang Anthropic ay nakakuha ng lugar sa segment ng enterprise gamit ang mga modelo tulad ng Claude Opus 4.6 at isang mas nakatuon sa seguridad na diskarte, ang Google ay nakikipagkumpitensya sa pamilyang Gemini at mga advanced na kakayahan ng multimodal. Sa kontekstong ito, nilalayon ng GPT-5.4 na iposisyon ang sarili bilang isang benchmark na modelo sa kapasidad ng ahente, paggamit ng computer, at pangmatagalang konteksto.
Kasabay nito, ang kilusan ay kasunod ng mga kampanyang tulad ng #Kanselahin ang ChatGPT at Mag-quitGPTAng mga aksyong ito ay nag-udyok sa daan-daang libong tao na kanselahin ang kanilang mga suskrisyon o mag-anunsyo ng boycott sa social media. Ang persepsyon na tinanggap ng OpenAI ang isang kontratang militar nang walang sapat na mga pananggalang, habang tinanggihan ito ng Anthropic, ay sumira sa ilan sa reputasyon ng kumpanya. Sa Europa, kung saan ang debate sa etikal na paggamit ng AI at regulasyon nito ay umuusad kasabay ng mga balangkas tulad ng paparating na AI Act, ang mga kasunduang ito ay binabantayan nang may partikular na atensyon.
Mga gastos sa imprastraktura at presyon para sa kakayahang kumita
Sa likod ng bawat bagong bersyon ng GPT ay naroon ang isang hindi gaanong nakikitang katotohanan: ang gastos ng pagpapatakbo ng lumalaking mga modelo na may napakalaking context window. Ang OpenAI ay humahawak ng mga numerong nagkakahalaga ng milyun-milyong dolyar sa paggastos sa imprastraktura at pag-computena may mga pagtataya ng malaking pagkalugi sa mga darating na taon sa kabila ng malaking paglago ng kita. Ang isang modelo tulad ng GPT-5.4, na may kakayahang magproseso ng hanggang isang milyong token at may mga paraan ng pangangatwiran na maaaring tumagal nang ilang oras, ay nangangailangan ng malaking lakas sa pag-compute bawat kahilingan.
Para mapigilan ang mga gastos na iyon, ang kumpanya ay tumataya sa pagmamay-ari o espesyalisadong hardware at sa pamamagitan ng mga kasunduan sa mga pangunahing provider ng cloud. Hinahati rin nito ang katalogo nito sa ilang antas (Instant, Thinking, Pro, Codex) upang isaayos kung gaano kalaking processing power ang inilalaan nito sa bawat uri ng kahilingan. Ang pagpapakilala ng mga configurable mode sa GPT-5.4, na nagbibigay-daan sa mga user na pumili sa pagitan ng mas mabilis at mas murang mga tugon o mas malalim na pagsusuri, ay naaayon sa pagtatangkang balansehin ang kapasidad at cost-effectiveness. Sa Europa, kung saan ang mga data center at pagkonsumo ng kuryente ay nasa ilalim ng pagsusuri ng mga regulasyon, ang ganitong uri ng modelo ay muling nagpapasigla sa debate tungkol sa epekto ng AI sa enerhiya.
Tungo sa isang bagong normal: mga ahente, seguridad at patuloy na pagbabago
Higit pa sa mga teknikal na detalye, pinatitibay ng GPT-5.4 ang isang trend na umuusbong na: ang paglipat mula sa mga chatbot patungo sa mga autonomous agentAng kombinasyon ng paggamit ng katutubong computer, pangmatagalang pamamahala ng konteksto, at mga dynamic na tool ay tumutukoy sa mga sistemang may kakayahang pamahalaan ang kumpletong proseso nang may paminsan-minsang interbensyon ng tao. Hinuhulaan ng mga kompanya ng pagsusuri na, sa pagtatapos ng 2026, isang malaking bahagi ng malalaking korporasyon ang gagamit ng mga arkitekturang nakabatay sa ahente mula sa seryeng GPT-5.x para sa mga kritikal na gawain, mula sa serbisyo sa customer hanggang sa panloob na pamamahala ng dokumento.
Ang hakbang na iyan ay may kaakibat na mga hindi komportableng tanong tungkol sa seguridad at kontrolKung ang isang modelo ay maaaring gumana nang ilang oras, kumukunsulta sa sensitibong datos at nagsasagawa ng mga aksyon sa mga panloob na sistema, ang mga mekanismo sa pagsubaybay at mga hadlang sa seguridad ay dapat na mas matatag. Ang mga tinig sa loob at labas ng industriya, kabilang ang komunidad ng pananaliksik sa Europa, ay matagal nang nagbabala na ang karera sa paglalabas ng lalong makapangyarihang mga modelo ay hindi maaaring higitan ang pagbuo ng mga epektibong pananggalang.
Gamit ang GPT-5.4, sinusubukan ng OpenAI na ipakita na maaari itong mag-alok ng mas maraming lakas, mas malawak na awtonomiya, at mas mataas na kahusayan nang hindi isinasakripisyo ang pagiging maaasahan. Ang modelo ay nagpapabuti sa mga benchmark, binabawasan ang mga error, gumagamit ng mas kaunting mga token, at may kakayahang maayos na hawakan ang computer, ngunit dumarating din ito sa gitna ng mga etikal na dilemma, mapagkumpitensyang presyon, at mga pagdududa tungkol sa pagpapanatili ng ekonomiya ng ganitong bilis ng inobasyon. Para sa mga kumpanya at propesyonal sa Espanya at sa iba pang bahagi ng Europa, ang tanong ay hindi na lamang kung ang teknolohiya ay kahanga-hanga, kundi... kung paano ito maisasama nang responsable sa iyong pang-araw-araw na buhay, na may malinaw na mga benepisyo at mapapamahalaang mga panganib.
