Top OpenAI's ChatGPT Fejler Under Besvarelse

Det er nu næsten 6 måneder siden, at OpenAI's ChatGPT blev lanceret. Faktisk har virksomheden for nylig lanceret ChatGPT 4. Denne teknologi har nu ført verden til et helt nyt niveau.

ChatGPT er en sprogmodel, der er drevet af kunstig intelligens og er blevet trænet til at udføre en række aktiviteter, herunder oversættelse af sprog, opsummering af information og besvarelse af spørgsmål. Modellens exceptionelle evner har vakt stor opmærksomhed, og som følge heraf begynder mange mennesker at stille spørgsmål ved deres beskæftigelsesmuligheder.

GPT-4 sprogbehandlingsmodellen kan bruges til at analysere massive mængder af data, hvorefter den kan generere indhold baseret på resultaterne af analysen. Desuden er den nye teknologi i stand til at analysere store mængder af tekst for at præsentere forbrugere med information om en specifik datapunkt.

Der er ingen tvivl om, at teknologien kommer til at blive i lang tid. Selvfølgelig hjælper den brugere på mange måder. På utallige lejligheder har den vist sin evne til at udføre alt lige fra at skrive scripts til at løse de sværeste opgaver. Der er intet, som ChatGPT ikke kan klare. Dog er der også nogle ting, der er sværere for ChatGPT.

1. Den kunstige intelligens-drevne ChatGPT led et tilbageslag, da den ikke bestod den eftertragtede fælles adgangsprøve (JEE) i Indien. Den fælles adgangsprøve er kendt for sin sværhedsgrad og tiltrækker hvert år tusindvis af studerende, der er interesseret i at blive optaget på de mest prestigefyldte ingeniørskoler i Indien. Det er en af de mest udfordrende kvantitative eksamener, der omfatter komplicerede diagrammer og tal.

Studerende, der er interesseret i at deltage i prestigefyldte uddannelsesinstitutioner som IITs og NITs, skal først bestå Joint Entrance Test. Ifølge rapporterne klarede ChatGPT sig ikke godt til JEE Advanced-eksamenen.

Resultaterne af ChatGPT's præstation i testen var mindre end tilfredsstillende, da den kun var i stand til at løse 11 af det samlede antal spørgsmål i papiret.

2. ChatGPT har tidligere haft succes med en række andre prominente og udfordrende test. Imponerende nok forsøgte og besvarede ChatGPT alle 200 spørgsmål på Den Nationale Kvalifikations- og Adgangseksamensprøve for Medicinske Skoler (NEET), hvor kandidater skal besvare 180 spørgsmål ud af i alt 200.

Trods dette forsøgte ChatGPT at besvare alle 200 spørgsmål, og resultaterne af dets præstation var 359 ud af 800. Specifikt klarede ChatGPT sig ekstraordinært godt i biologi-komponenten af NEET-testen og viste bedre nøjagtighed i sine svar på spørgsmålene, der blev stillet i den sektion. ChatGPT's præstation i NEET-testen antyder, at den har evnen til at præstere på et højt niveau i andre områder, på trods af at den ikke bestod JEE Advanced-eksamenen.

Nederlaget, som ChatGPT oplevede i JEE Advanced-testen, demonstrerer begrænsningerne, der er til stede selv i de mest avancerede AI-modeller. Selvom kunstig intelligens har potentialet til at forstyrre mange forskellige brancher, har den stadig lang vej at gå, før den kan konkurrere med menneskelig intelligens i svære opgaver.

OpenAI's chatbot ChatGPT har været endnu en gang mislykket i en konkurrenceprøve.

3. ChatGPT tog eksamen ved Union Public Service Commission (UPSC) på anmodning fra Analytics India Magazine (AIM). UPSC-eksamenen betragtes som en af de mest udfordrende konkurrenceprøver i verden. Hvert år deltager over 10 lakh aspiranter i UPSC-eksamenen, men kun 5% af dem består den.

AIM har leveret ChatGPT med 100 spørgsmål fra UPSC Prelims 2022.

Chatbot gjorde det dårligt på UPSC Prelims 2022 eksamen, scorede kun 54 ud af 100 på spørgsmålspapir 1 (Sæt A), når den krævede score var 87,54. Dette betyder, at ChatGPT ikke bestod UPSC-testen.

Spørgsmålene var baseret på emner inden for indisk generel videnskab, historie, geografi, økonomi, økologi og aktuelle begivenheder. Chatbotten klarede sig godt med spørgsmål om steder og økonomier, men det fejlede miserabelt, når det blev spurgt om historiske begivenheder, der fandt sted før år 2021.

Det faktum, at ChatGPTs datasæt kun strækker sig til 2021, er sandsynligvis afgørende for AI-bottens manglende evne til at besvare alle eksamensspørgsmål korrekt.

4. Udover det var CLAT-eksamensresultaterne for ChatGPT også over gennemsnittet. Under CLAT UG-eksamen var AI-værktøjet kun succesfuldt i at løse 50,83 procent af spørgsmålene præcist. ChatGPT var ikke succesfuldt inden for logik og kvantitativ spørgsmålskategorierne. Dog klarede det sig exceptionelt godt inden for engelsk og aktuelle begivenheder. Når det kom til spørgsmål baseret på koncepter, havde dette værktøj store vanskeligheder.

Udgivet i november 2022 er ChatGPT gået ret godt i USA. Denne kunstige intelligens-teknologi har haft succes med at bestå United States Medical Licensing Test (USMLE) og forskellige MBA-eksamener i USA. Udover det har den også haft succes med at bestå Google Coding Interviews for Level 3 Engineers.

Veterinære fagfolk blev taget på sengen for nylig, da ChatGPT var i stand til at diagnosticere korrekt en hunds tilstand og redde dyrets liv.

Mange lande har imidlertid nu forskellige synspunkter på ChatGPT og er klar til at træffe stærke foranstaltninger mod den nye innovation. For nylig er teknologien blevet forbudt i to store lande, herunder Tyskland og Italien. Disse nationer hævder, at OpenAI's ChatGPT mangler de nødvendige sikkerhedsforanstaltninger for at forhindre mindreårige i at blive udsat for stødende materiale, såsom et aldersverifikationssystem.

Ulrich Kelber, den tyske data protection commissioner, har udstedt en advarsel om, at Chat-GPT kan være genstand for et potentielt forbud i Tyskland på grund af bekymringer om sikkerheden af brugernes data, ligesom det skete i Italien.

Nu skal vi se, hvordan kunstig intelligensdrevet teknologi vil opføre sig i fremtiden.

Tak fordi du læser! Bliv ved med at følge med for flere informative artikler!

Top OpenAI's ChatGPT mislykkes, mens det besvarer

Relaterede Artikler