ChatGPT 5.5: Ito ang bagong hakbang ng OpenAI sa awtonomiya, gastos, at mga propesyonal na gamit

  • Pinahuhusay ng ChatGPT 5.5 ang pangangatwiran, awtonomiya, at paggamit ng computer kumpara sa GPT-5.4, habang pinapanatili ang katulad na latency.
  • Siya ay mahusay sa agent programming, trabaho sa opisina, pagsusuri ng datos, at siyentipikong pananaliksik, kung saan nakakamit niya ang pinakamataas na resulta sa mga pangunahing benchmark.
  • Tumataas ang presyo bawat token, ngunit ang mas mataas na kahusayan at mas mababang pagkonsumo ay nangangahulugan na ang epektibong gastos ay maaaring mas mababa sa mga kumplikadong gawain.
  • Pinapalakas ng OpenAI ang seguridad sa cybersecurity at biology at inilalapat ang GPT-5.5 at ang Pro na bersyon nito para sa mga gumagamit ng Plus, Pro, Business at Enterprise.

ChatGPT5.5

Ang OpenAI ay gumawa ng isa pang matapang na pahayag kasama ang ang paglulunsad de Ang GPT-5.5, ang modelo na naglalagay sa pinakabagong henerasyon ng ChatGPT sa mas mataas na antas ng awtonomiya at pangangatwiran Batay sa aming nakita sa ngayon, inihaharap ito ng kumpanya bilang ang pinaka-intuitive at may kakayahang sistema nito para sa paghawak ng mga kumplikadong gawain mula simula hanggang katapusan, na binabawasan ang pangangailangan para sa patuloy na pangangasiwa ng gumagamit.

Ang hakbang na ito ay dumarating sa isang pagkakataon karera para sa pamumuno sa generative artificial intelligenceDahil pinapabilis din ng Anthropic at Google ang sarili nilang mga modelo, unang ilulunsad ang GPT-5.5 sa ChatGPT at Codex para sa mga nagbabayad na user, at pinagsasama ang mga pagpapabuti sa programming, trabaho sa opisina, siyentipikong pananaliksik, at paggamit ng computer sa totoong mundo, kapalit ng isang... Ang pagtaas ng presyo na sinusubukang bigyang-katwiran ng OpenAI na may kahanga-hangang kahusayan sa paggamit ng mga token.

Ano ang GPT-5.5 at ano ang papel na ginagampanan nito sa estratehiya ng OpenAI?

Ayon sa OpenAI, Ang GPT-5.5 ay nagmamarka ng isang bagong hakbang sa patuloy na pangangatwiran at nagsasariling gawain gamit ang isang computerAng modelo ay dinisenyo upang magsagawa ng mahahabang gawain na may maraming hakbang: maaari itong tumanggap ng mga hindi maayos na tagubilin, hatiin ang mga ito, planuhin kung ano ang unang gagawin, pumili at humawak ng mga kagamitan, suriin ang sarili nitong mga resulta, at magpatuloy kahit na may mga kalabuan sa pahayag.

Tinutukoy ito ng kumpanya bilang AI nito pinakamadaling maunawaan hanggang sa kasalukuyanSa halip na sagutin lamang ang mga nakahiwalay na tanong, ang GPT-5.5 ay gumaganap bilang isang ahente: pinapanatili nito ang konteksto sa panahon ng malawakang proseso, nagna-navigate sa impormasyon sa web, nagsasagawa ng mga utos, nagmamanipula ng mga dokumento at mga aplikasyon sa opisina, at nagbabalik ng mga paunang nakabalangkas na resulta, na handa nang gamitin sa mga propesyonal na kapaligiran.

Kasama sa paglulunsad ang isang Bersyon ng GPT-5.5 Pro, na nakatuon sa mas kumplikadong mga gawain Mayroon na itong mga gumagamit na nangangailangan ng mas mahigpit na mga sagot sa mga larangan tulad ng batas, negosyo, edukasyon, o advanced na pagsusuri ng datos. Nagtatampok din ang ChatGPT ng isang mode GPT-5.5 Pag-iisipdinisenyo para sa mga partikular na mahihirap na problema sa programming, pananaliksik, o pagsusuri ng impormasyon.

Awtonomiya at totoong paggamit ng computer: mula chatbot hanggang work agent

Isa sa mga malaking taya ng OpenAI ay ang kakayahan ng GPT-5.5 na gumanap bilang isang ahente ng awtonomo sa kompyuter. Maaaring maghanap ang modelo ng impormasyon, magpasya kung ano ang mahalaga, pagsamahin ang mga mapagkukunan, patakbuhin ang software at mga kagamitan nang sunod-sunod, at baguhin ang mga nakakalat na materyales tungo sa mga kapaki-pakinabang na resulta, nang hindi kinakailangang maingat na tukuyin ng gumagamit ang bawat hakbang.

Sa pang-araw-araw na buhay, ito ay isinasalin sa mga gawain tulad ng bumuo ng mga kumplikadong dokumento, spreadsheet o presentasyonPagsusuri ng mga kontrata, paghahanda ng mga ulat, pagsusuri ng mga database, o paglikha ng malawak na buod mula sa maraming file. Inaangkin ng kumpanya na mas mabilis na nauunawaan ng GPT-5.5 ang mga pangangailangan ng gumagamit at mas malaking bahagi ng trabaho mismo ang nagagawa nito kaysa sa mga nakaraang bersyon.

Upang ilarawan ang pagbabagong ito, binanggit ng OpenAI ang mga panloob na halimbawa: mga pangkat sa pananalapi na gumagamit ng Codex at GPT-5.5 upang suriin ang sampu-sampung libong mga form sa buwis Sa mas maikling panahon, awtomatiko nang naisasagawa ng mga departamento ng komunikasyon ang mga balangkas ng pagmamarka at panganib sa malalaking dami ng mga kahilingan, o dahil sa mga automated workflow, lubos na nabawasan ng mga lugar ng marketing at produkto ang oras na ginugugol sa mga pana-panahong ulat.

Pagganap sa agentive programming at software development

Ipinapakita ng GPT-5.5 ang mga pagpapabuti sa programming at sa tinatawag ng OpenAI na "agent coding"—ang paggamit ng AI bilang isang ahente na sumusulat, nagde-debug, at nagpapanatili ng end-to-end code. Sa mga development environment, maaaring pamahalaan ng modelo ang malalaking repository, magmungkahi ng mga kumplikadong refactor, tukuyin ang pinagmumulan ng mga error, at mahulaan kung aling mga bahagi ng sistema ang maaapektuhan ng isang pagbabago.

Sa benchmark Terminal-Bench 2.0, na sumusukat sa mga kumplikadong daloy ng trabaho sa command-line, nakakamit ng GPT-5.5 ang isang 82,7%, malinaw na mas mahusay kaysa sa GPT-5.4, at ginagawa ito habang kumukonsumo ng mas kaunting mga token. Sa SWE-Bench ProNakatuon sa paglutas ng mga isyu sa totoong mundo ng GitHub, naabot ng modelo ang 58,6%at sa panloob na pagsusuri Eksperto-SWE, na may mga gawaing tinatayang oras ng tao ay humigit-kumulang 20 oras, mas mataas din ito kaysa sa nauna rito.

Itinuturo ng mga inhinyero na sumubok sa mga naunang bersyon na Mas nauunawaan ng GPT-5.5 ang pangkalahatang arkitektura ng mga kumplikadong sistemaSa mga panloob na pagsubok, binabanggit ang mga kaso tulad ng pagsasama ng sangay na may daan-daang pagbabago na nalutas sa loob ng halos dalawampung minuto, halos kumpletong muling pagdidisenyo ng mga subsystem (halimbawa, isang sistema ng komento sa isang collaborative editor) o maagang pagtuklas ng mga pagkakamali na dating nangangailangan ng mas maraming pag-ulit.

Sa Codex, ang software engineering environment ng OpenAI, ang GPT-5.5 ay may context window na hanggang 400.000 token, na nagbibigay-daan dito upang gumana sa napakalaking codebase. Nagtatampok din ito ng fast mode na bumubuo ng humigit-kumulang [bilang ng mga token na kailangan]. 1,5 beses na mas mabilis, bagama't may mas mataas na halaga bawat token, na idinisenyo para sa mga taong inuuna ang bilis ng pagtugon.

Trabahong may kaalaman, negosyo, at pang-araw-araw na paggamit sa opisina

Higit pa sa pagbuo ng software, ang GPT-5.5 ay dinisenyo bilang isang kasangkapan para sa propesyonal na gawain sa opisina, pagkonsulta, o mga kapaligiran sa pagsusuri ng datos. Pinaninindigan ng OpenAI na ang parehong mga kakayahan na nagpapabuti sa programming ay nagbibigay-daan na ngayon para sa mas epektibong mga gawain sa dokumentasyon at pagsusuri.

Sa benchmark GDPval, na sumusuri sa kakayahang makagawa ng mga tinukoy na gawaing eksperto sa 44 na trabahoAng GPT-5.5 ay nakakakuha ng 84,9% ng mga tamang sagot o tabla. Sa Na-verify ng OSWorldIsang pagsubok na idinisenyo upang mapatunayan kung kayang hawakan ng modelo ang mga kapaligirang pangkompyuter sa totoong mundo nang awtomatiko, ang dumating sa 78,7%. Sa Tau2-bench Telecom, na nakatuon sa serbisyo sa customer sa sektor ng telekomunikasyon, ay umaabot sa isang 98% nang hindi kinakailangang isaayos ang prompt, na nagpapahiwatig ng mataas na pagganap sa mga sitwasyon ng suporta.

Para sa paggamit ng negosyo, itinatampok ng OpenAI na Mahigit 85% ng kanilang mga kawani ang gumagamit ng Codex linggu-linggo sa mga larangan tulad ng inhenyeriya, pananalapi, marketing, datos, o produkto. Ang mga halimbawa tulad ng automation ng mga lingguhang ulat, na nakakatipid sa pagitan ng lima at sampung oras bawat tao bawat linggo, ay naglalarawan ng uri ng mga benepisyong iniuugnay ng kumpanya sa bagong modelo kapag isinama ito sa mga proseso ng negosyo.

Pananaliksik na siyentipiko, biyolohiya, at advanced na matematika

Ang pananaliksik na siyentipiko ay isa pang pangunahing tema sa presentasyon ng GPT-5.5. Tinatarget ng OpenAI ang mga daloy ng trabaho kung saan ito kinakailangan. magsaliksik ng mga hipotesis, mangalap ng ebidensya, sumubok ng mga pagpapalagay, bigyang-kahulugan ang mga resulta, at magpasya sa susunod na eksperimento, isang kapaligiran kung saan ang patuloy na pangangatwirang kontekstwal ay mahalaga.

Sa mga pagsubok tulad ng GeneBenchNakatuon sa mga gawain sa biyolohiya at henetika, ang GPT-5.5 ay nagpapabuti sa mga resulta ng GPT-5.4, at sa variant GPT-5.5 Pro Mas mataas pa ang nakukuha nitong marka. BixBenchNakatuon sa bioinformatics at quantitative biology, nakakamit din ng bagong modelo ang pinakamahusay na pagganap sa mga sistemang may nailathalang datos hanggang sa kasalukuyan, ayon sa impormasyong ibinigay ng kumpanya.

Nagbanggit pa nga ang OpenAI ng mga halimbawa ng gamit sa advanced na matematika, kung saan ang isang Isang panloob na bersyon ng GPT-5.5 ang nakipagtulungan sa paghahanap para sa isang bagong pagsubok na may kaugnayan sa mga off-diagonal na numero ng RamseyIto ay kalaunan ay napatunayan gamit ang Lean formal assistant. Inilalahad ng kumpanya ang kasong ito bilang isang halimbawa kung paano ang modelo ay hindi lamang bumubuo ng code o mga paliwanag, kundi maaari ring mag-ambag sa mga argumento sa matematika sa mga kumplikadong lugar.

Sa praktikal na pananalita, binanggit ang mga testimonya mula sa mga mananaliksik na gumamit ng GPT-5.5 Pro para sa suriin ang mga dataset ng ekspresyon ng gene na may sampu-sampung libong baryabol at isang makabuluhang bilang ng mga samplepagkuha ng mga detalyadong ulat, mga bagong anggulo ng pagsusuri, at mga pangunahing tanong sa isang takdang panahon na, ayon sa kanilang mga kalkulasyon, ay mas matagal kung tutugunan lamang gamit ang paggawa ng tao.

Latency, oras ng pangangatwiran, at kahusayan ng token

Sa likod ng paglulunsad ng GPT-5.5 ay naroon ang isang patuloy na mensahe: Pinapataas nito ang katalinuhan ng modelo nang hindi binabawasan ang bilis ng pagtugon.Inaangkin ng OpenAI na ang bagong sistema ay tumutugma sa latency bawat token ng GPT-5.4 sa totoong serbisyo, kahit na mas may kakayahan ito, na hindi pangkaraniwan sa mas malalaki at mas kumplikadong mga modelo.

Isa sa mga pangunahing punto ay ang oras ng pangangatwiran na kinakailangan upang makumpleto ang mga kumplikadong gawainAng mga naunang gumagamit na nagkumpara sa gawi sa mga nakaraang bersyon ay nag-ulat na ang mga prosesong dating nangangailangan ng 20 hanggang 40 minuto ng trabaho ay nareresolba na ngayon sa loob lamang ng tatlo o apat na minuto, na nagpapanatili—at nagpapabuti pa—sa kalidad ng mga tugon.

Ang pakinabang na ito ay hindi lamang nagmumula sa bilis, kundi pati na rin sa isang mas mahusay na pamamahala ng tokenAng GPT-5.5 ay nangangailangan ng mas kaunting token upang makamit ang maihahambing o mas mahusay na mga resulta kaysa sa GPT-5.4, na binabawasan ang parehong kabuuang oras ng pagproseso at ang gastos na nauugnay sa bawat daloy ng trabaho. Sa mga sitwasyong may mataas na dami ng query o masinsinang automation, ang pagkakaibang ito ay maaaring maging mahalaga.

Ipinaliwanag ng OpenAI na, upang mapanatili ang latency, kinailangan nitong muling pagdisenyo ng hinuha bilang isang pinagsamang sistemaAng GPT-5.5 ay dinisenyo, sinanay, at ipinatupad sa makabagong imprastraktura na nakabatay sa hardware ng NVIDIA (GB200 at GB300 NVL72), at ang GPT-5.5 mismo at ang Codex ay ginamit upang ma-optimize ang load balancing at partitioning heuristics, na may pagtaas ng mahigit 20% sa bilis ng pagbuo ng token sa kanilang mga sistema.

Mga presyo, aktwal na gastos at paghahambing sa GPT-5.4

Bagama't ang GPT-5.5 ay matatagpuan sa mataas na saklaw ng presyo bawat tokenIginiit ng OpenAI na, sa pagsasagawa, maaari itong maging mas matipid kaysa sa nauna nito at ilan sa mga kakumpitensya. Ang dahilan ay ang kombinasyon ng mas mataas na kahusayan ng token at mas kaunting pangangailangan para sa mga muling pagsubok o mga pagwawasto.

Sa API, ang mga presyong sanggunian na iniulat para sa GPT-5.5 ay $5 bawat milyong input token at $30 bawat milyong output tokenna may context window na umaabot hanggang isang milyong token. Para sa GPT-5.5 Pro, ang mga rate ay tumataas sa $30 kada milyong token ang naipasok at $180 kada milyong token ang nailabasmalinaw na pag-target sa mga gamit kung saan ang karagdagang halaga ng tugon ay mas malaki kaysa sa gastos.

Nag-aalok din ang OpenAI ng mga mode tulad ng Batch at Flex, na may mga rate na humigit-kumulang kalahati ng karaniwang presyo.at isang Priority mode na nagpaparami ng gastos ng 2,5 kapalit ng mas mataas na queue priority at mas maikling response times. Inaamin ng kumpanya na ang GPT-5.5 ay mas mahal kaysa sa GPT-5.4 sa nominal na termino, ngunit ikinakatuwiran na ang pagbawas sa mga token na kinakailangan sa bawat gawain at ang mas maikling oras ng pangangatwiran ay nagbibigay-katwiran sa gastos. Maaari nilang bawasan ang kabuuang gastos ng mga kumplikadong proyekto kumpara sa ibang mga modelo..

Sa merkado, inilalagay ng patakarang ito ang GPT-5.5 sa itaas ng mga nakaraang modelo ng OpenAI at sa ibaba ng mga high-end na alternatibo na, ayon sa mga pagtatantya na ibinahagi sa panahon ng presentasyon, ay maaaring nasa pagitan ng lima at sampung beses na mas mahal sa praktikal na mga termino kung isasaalang-alang ang kombinasyon ng presyo, mga token na nakonsumo, at kalidad ng resulta.

Mahabang konteksto at pagganap sa mga benchmark ng pangangatwiran

Isa pang nakikitang pagpapabuti ng GPT-5.5 ay ang kakayahan nitong pagtatrabaho sa napakalawak na konteksto nang hindi nawawala ang thread. Sa mga pagsubok tulad ng Graphwalks BFS 1Mang modelo ay umaabot sa isang 45,4% kumpara sa 9,4% para sa GPT-5.4, at sa OpenAI MRCR v2 na may mga konteksto sa pagitan ng 512K at 1M na mga token, tumataas ito sa 74,0%, kumpara sa 36,6% sa nakaraang bersyon.

Sa larangan ng abstraktong pangangatwiran, itinatala ng GPT-5.5 ang isang 95,0% sa ARC-AGI-1 at 85,0% sa ARC-AGI-2, na may mga makabuluhang pagpapabuti kumpara sa GPT-5.4. Sa mga advanced na pagsusulit sa kaalaman tulad ng GPQA DiamondNakatuon sa mga tanong na lubhang mahirap, nakakakuha ito ng 93,6%at sa mga pagtatasa tulad ng Huling Pagsusulit ng Sangkatauhan Lumalagpas ito sa 50% kapag pinapayagang gumamit ng mga panlabas na kagamitan.

Binibigyang-diin ng OpenAI na marami sa mga pagtatasang ito ay isinagawa noong mga kapaligirang pananaliksik na may mga konpigurasyon ng pangangatwiran sa napakataas na antasSamakatuwid, ang mga resulta ay maaaring bahagyang magkaiba sa mga nakikita ng mga gumagamit ng ChatGPT sa produksyon. Gayunpaman, nais iparating ng kumpanya ang ideya na ang GPT-5.5 ay kumakatawan sa isang Isang praktikal na pagsulong sa mga gawain sa totoong mundo, hindi lamang isang akademikong pagpapabuti sa mga benchmark table.

Seguridad, cybersecurity at responsableng paggamit

Ang pagtaas ng mga kakayahan ay nangangahulugan ng pagpapalakas ng mga pananggalang sa seguridadAyon sa OpenAI, ilulunsad ang GPT-5.5 kasama ang pinaka-advanced na sistema ng proteksyon nito sa kasalukuyan, matapos sumailalim sa mga panloob at panlabas na pagsusuri, mga partikular na balangkas ng kahandaan, at mga proseso ng red teaming kasama ang mga espesyalista sa cybersecurity at biology.

Sa loob ng balangkas nito Framework ng PaghahandaInuuri ng kompanya ang mga kakayahan ng GPT-5.5 bilang Biyolohiya, kimika, at cybersecurity sa antas na "Mataas"nang hindi umaabot sa antas na "Kritikal". Gayunpaman, kinikilala nito na ang modelo ay mas epektibo kaysa sa GPT-5.4 sa paghahanap at pagsasamantala sa mga kahinaan, at samakatuwid ay nag-deploy mas mahigpit na mga klasipikasyon para sa mga sensitibong kahilingan at mga mekanismo laban sa paulit-ulit na mapanganib na paggamit, isang bagay na maaaring mas mahigpit para sa ilang teknikal na gumagamit.

Kasabay nito, nilalayon ng OpenAI na palawakin ang access sa mas advanced na mga kakayahan para sa mga na-verify na gamit sa pagtatanggol sa pamamagitan ng mga programa tulad ng Pinagkakatiwalaang Pag-access para sa CyberAng mga kagamitang ito ay partikular na naglalayong sa mga organisasyong responsable sa pagprotekta sa mga kritikal na imprastraktura. Ang ideya ay upang magbigay ng malalakas na kagamitan sa depensa nang hindi niluluwagan ang mga kontrol laban sa mga potensyal na paggamit sa opensiba.

Sa larangan ng pananaliksik sa biyolohiya, ang kompanya ay naglunsad ng mga inisyatibo tulad ng mga programang gantimpala para sa pagtuklas ng mga biyolohikal na pagkakamali sa pag-uugali ng modelo, na may layuning tulungan ang komunidad ng mga siyentipiko na matukoy ang mga kapintasan at mapabuti ang mga pananggalang bago ang mas malawak na pag-deploy.

Pagkakaroon ng GPT-5.5 at ang pag-deploy nito sa mga produkto

Nagsimula na ang pag-deploy ng GPT-5.5 para sa Mga gumagamit ng ChatGPT at Codex Plus, Pro, Business at Enterprisesa parehong personal at korporasyong kapaligiran. Sa Codex, ang modelo ay isinama sa mga daloy ng trabaho sa pagbuo ng software na may pinalawak na window ng konteksto at mga rapid response mode.

La Bersyon ng GPT-5.5 Pro Ito ay unti-unting ina-activate para sa mga gumagamit ng Pro, Business, at Enterprise na nangangailangan ng karagdagang detalye at katumpakan, lalo na sa mga regulated o high-impact na larangan kung saan maaaring magastos ang mga error. Sa ChatGPT, nagsisimula na ring makakita ang mga gumagamit ng mga partikular na opsyon tulad ng GPT-5.5 Pag-iisip para sa mga kumplikadong problema sa pananaliksik o pagsusuri.

Tungkol sa API, ang OpenAI ay nagtatrabaho sa Isama ang GPT-5.5 at GPT-5.5 Pro sa iyong mga endpoint ng Mga Tugon at Pagkumpleto ng Chat na may mga context window na umaabot sa isang milyong token. Ipinapahiwatig ng kumpanya na ang access ay palalawakin habang natutugunan ang mga kinakailangan sa panloob na seguridad at kapasidad ng imprastraktura, upang maisama ng mga developer ang modelo sa kanilang sariling mga aplikasyon kapag nakumpleto na ang yugtong ito.

Ang pagdating ng GPT-5.5 ay nagpapatibay ng isang pagbabago sa yugto ng ebolusyon ng ChatGPT: Ang pokus ay lumilipat mula sa simpleng pagbuo ng teksto patungo sa komprehensibong automation ng mga digital na gawain, na may mas autonomous na mga modelo na may kakayahang mangatwiran sa mas mahabang panahon at magtrabaho sa mga totoong sistema, kapalit ng mas mataas na presyo at isang lumalaking debate sa seguridad at pamamahala.Sa kontekstong Europeo kung saan umuunlad ang regulasyon ng AI at naghahangad ang mga kumpanya ng kahusayan nang hindi nawawalan ng kontrol, ang paraan ng pag-aampon—o paglimita—ng mga organisasyon, developer, at administrasyon sa paggamit ng GPT-5.5 ay maaaring kasing-kaugnay ng mga benchmark na datos na kasama ng bagong modelong ito.

Ahente ng ChatGPT
Kaugnay na artikulo:
ChatGPT Agent: Ang paglukso ng OpenAI sa mga autonomous na ahente upang i-automate ang mga kumplikadong gawain