ChatGPT V4 aces lub bar, SATs thiab tuaj yeem txheeb xyuas kev siv hauv ETH cov ntawv cog lus

GPT-4, qhov tseeb version ntawm Artificial Intelligence (AI) chatbot, ChatGPT, tuaj yeem xeem dhau cov kev xeem hauv tsev kawm theem siab thiab kev xeem hauv tsev kawm ntawv txoj cai nrog cov qhab nia nyob rau hauv 90 feem pua ​​​​thiab muaj peev xwm ua haujlwm tshiab uas tsis tuaj yeem ua tau nrog cov ntawv ua ntej.

Cov nuj nqis los ntawm GPT-4 cov qhab nia xeem tau muab qhia rau lub Peb Hlis 14 los ntawm nws tus tsim OpenAI qhia tias nws tuaj yeem hloov cov duab, suab thiab video nkag mus rau cov ntawv ntxiv rau kev tuav "ntau yam lus qhia tsis zoo" ntau yam tswv yim thiab ntseeg tau.

"Nws dhau qhov simulated bar xeem nrog cov qhab nia nyob ib ncig ntawm 10% ntawm cov neeg xeem," OpenAI ntxiv. "Qhov sib txawv, GPT-3.5 tus qhab nia nyob ib puag ncig hauv qab 10%.

Cov duab qhia tau hais tias GPT-4 tau qhab nia ntawm 163 hauv 88 feem pua ​​​​ntawm kev xeem LSAT - cov tub ntxhais kawm ntawv qib siab yuav tsum xeem dhau hauv Tebchaws Meskas kom nkag mus rau hauv tsev kawm ntawv txoj cai.

Kev xeem tau ntawm GPT-4 thiab GPT-3.5 ntawm ntau qhov kev xeem hauv Teb Chaws Asmeskas tsis ntev los no. Qhov chaw: OpenAI

GPT4 tus qhab nia yuav ua rau nws nyob hauv txoj haujlwm zoo kom nkag mus rau hauv 20 lub tsev kawm ntawv txoj cai lij choj thiab tsuas yog qee qhov qhab nia luv ntawm cov qhab nia uas xav tau rau kev lees paub rau cov tsev kawm muaj koob npe xws li Harvard, Stanford, Princeton lossis Yale.

Cov ntawv ua ntej ntawm ChatGPT tsuas yog qhab nia 149 ntawm LSAT tau muab tso rau hauv qab 40%.

GPT-4 kuj tau qhab nia 298 ntawm 400 hauv Uniform Bar Exam - ib qho kev xeem uas tau ua los ntawm cov tub ntxhais kawm tiav txoj cai lij choj uas nyuam qhuav tso cai rau lawv los xyaum ua tus kws lij choj hauv txhua lub tebchaws hauv Teb Chaws Asmeskas.

UBE cov qhab nia yuav tsum tau lees paub los ua txoj cai lij choj hauv txhua lub tebchaws Asmeskas. Qhov chaw: National Conference ntawm Bar Examiners

Cov qub version ntawm ChatGPT tawm tsam hauv qhov kev xeem no, ua tiav hauv qab 10% nrog tus qhab nia ntawm 213 ntawm 400.

Raws li SAT Evidence-Based Reading & Writing thiab SAT Math kev xeem xeem los ntawm US cov tub ntxhais kawm theem siab los ntsuas lawv cov kev npaj hauv tsev kawm qib siab, GPT-4 tau qhab nia hauv 93rd thiab 89th feem pua.

GPT-4 ua tau zoo hauv cov kev tshawb fawb "nyuaj" ib yam nkaus, tshaj tawm cov qhab nia nruab nrab feem pua ​​​​hauv AP Biology (85-100%), Chemistry (71-88%) thiab Physics 2 (66-84%).

Cov qhab nia xeem ntawm GPT-4 thiab GPT-3.5 ntawm ntau qhov kev xeem US tsis ntev los no. Source: OpenAI.

Txawm li cas los xij nws cov qhab nia AP Calculus yog qhov nruab nrab, nyob rau hauv 43r rau 59 feem pua.

Lwm qhov chaw uas GPT-4 tsis muaj yog nyob rau hauv kev xeem ntawv Askiv, tshaj tawm cov qhab nia hauv 8th mus rau 44 feem pua ​​​​ntawm ob qhov kev xeem sib cais.

OpenAI tau hais tias GPT-4 thiab GPT-3.5 tau txais cov kev xeem no los ntawm 2022-2023 kev xeem xyaum, thiab tias "tsis muaj kev cob qhia tshwj xeeb" raug coj los ntawm cov cuab yeej ua cov lus:

“Peb tsis muaj kev cob qhia tshwj xeeb rau cov kev xeem no. Ib feem tsawg ntawm cov teeb meem hauv kev xeem tau pom los ntawm tus qauv thaum lub sijhawm kev cob qhia, tab sis peb ntseeg tias cov txiaj ntsig los ua tus sawv cev. "

Cov txiaj ntsig tau ua rau muaj kev ntshai hauv zej zog Twitter ib yam nkaus.

Related: ChatGPT yuav cuam tshuam li cas Web3 chaw? Kev lag luam teb

Nick Almond, tus tsim ntawm FactoryDAO hais rau nws 14,300 Twitter followers thaum Lub Peb Hlis 14 tias GPT4 yuav "tshem tib neeg" thiab nws yuav "tso" kev kawm thoob ntiaj teb.

Yav tas los tus thawj coj Coinbase, Conor Grogan, tau hais tias nws tau ntxig daim ntawv cog lus ntse Ethereum rau hauv GPT-4 thiab tam sim ntawd taw qhia rau ntau qhov "kev nyab xeeb tsis zoo" thiab piav qhia txog yuav ua li cas cov cai tuaj yeem siv tau:

Yav dhau los ntse daim ntawv cog lus tshawb xyuas ntawm ChatGPT pom tias nws thawj version kuj muaj peev xwm ntawm kev pom cov kab kab kab mus rau qhov tsim nyog ib yam nkaus.

Rowan Cheung, tus tsim ntawm AI tsab ntawv xov xwm "The Rundown" tau tshaj tawm cov vis dis aus ntawm GPT sau ib txhais tes kos lub vev xaib cuav ntawm ib daim ntawv rau hauv code.