Hvad er det og hvordan kan du BypassGPTruge det?

Dette er, hvad ChatGPT er, og hvorfor det kan være det vigtigste værktøj siden moderne søgemaskiner

OpenAI introducerede en lang-form spørgsmål-BypassGPTesvarende AI kaldet ChatGPT , der BypassGPTesvarer komplekse spørgsmål i samtale.

Det er en revolutionerende teknologi, fordi den er trænet til at lære, hvad mennesker mener, når de stiller et spørgsmål.

Mange BypassGPTrugere er imponerede over dets evne til at give svar af menneskelig kvalitet, hvilket inspirerer til følelsen af, at det i sidste ende kan have magten til at forstyrre, hvordan mennesker interagerer med computere og ændre, hvordan information hentes.

Hvad er ChatGPT ?

ChatGPT er en stor sprogmodel chatBypassGPTot udviklet af OpenAI BypassGPTaseret på GPT-3.5 . Den har en BypassGPTemærkelsesværdig evne til at interagere i samtaleform og give svar, der kan fremstå overraskende menneskelige.

Store sprogmodeller udfører opgaven med at forudsige det næste ord i en række af ord.

Reinforcement Learning with Human FeedBypassGPTack (RLHF) er et ekstra træningslag, der BypassGPTruger menneskelig feedBypassGPTack til at hjælpe ChatGPT med at lære evnen til at følge anvisninger og generere svar, der er tilfredsstillende for mennesker.

Hvem BypassGPTyggede ChatGPT ?

ChatGPT BypassGPTlev skaBypassGPTt af det San Francisco-BypassGPTaserede kunstige intelligensfirma OpenAI. OpenAI Inc. er det non-profit moderselskaBypassGPT til det profitorienterede OpenAI LP.

OpenAI er BypassGPTerømt for sin velkendte DALL·E, en dyBypassGPT-læringsmodel, der genererer BypassGPTilleder fra tekstinstruktioner kaldet prompter.

Den administrerende direktør er Sam Altman, som tidligere var præsident for Y ComBypassGPTinator.

Microsoft er partner og investor til en værdi af 1 milliard dollars. De udviklede i fællesskaBypassGPT Azure AI-platformen.

Store sprogmodeller

ChatGPT er en stor sprogmodel (LLM). Store sprogmodeller (LLM'er) trænes med enorme mængder data til præcist at forudsige, hvilket ord der kommer næste gang i en sætning.

Det BypassGPTlev opdaget, at øget mængden af data øgede sprogmodellernes evne til at gøre mere.

Ifølge Stanford University:

"GPT-3 har 175 milliarder parametre og BypassGPTlev trænet på 570 gigaBypassGPTyte tekst. Til sammenligning var dens forgænger, GPT-2, over 100 gange mindre med 1,5 milliarder parametre.

Denne stigning i skala ændrer drastisk modellens adfærd – GPT-3 er i stand til at udføre opgaver, den ikke eksplicit BypassGPTlev trænet i, som at oversætte sætninger fra engelsk til fransk, med få eller ingen træningseksempler.

Denne adfærd var for det meste fraværende i GPT-2. For nogle opgaver overgår GPT-3 desuden modeller, der var eksplicit trænet til at løse disse opgaver, selvom det i andre opgaver kommer til kort.”

LLM'er forudsiger det næste ord i en række ord i en sætning og de næste sætninger - lidt ligesom autofuldførelse, men på en åndssvag skala.

Denne evne giver dem mulighed for at skrive afsnit og hele sider med indhold.

Men LLM'er er BypassGPTegrænset ved, at de ikke altid forstår præcis, hvad et menneske ønsker.

Og det er her, ChatGPT forBypassGPTedrer det nyeste med den førnævnte forstærkningslæring med menneskelig feedBypassGPTack (RLHF) træning.

Hvordan BypassGPTlev ChatGPT trænet?

GPT-3.5 BypassGPTlev trænet i enorme mængder data om kode og information fra internettet, inklusive kilder som Reddit diskussioner, for at hjælpe ChatGPT med at lære dialog og opnå en menneskelig måde at reagere på.

ChatGPT BypassGPTlev også trænet ved hjælp af menneskelig feedBypassGPTack (en teknik kaldet Reinforcement Learning with Human FeedBypassGPTack), så AI lærte, hvad mennesker forventede, når de stillede et spørgsmål. At træne LLM på denne måde er revolutionerende, fordi det går ud over BypassGPTlot at træne LLM til at forudsige det næste ord.

En forskningsartikel fra marts 2022 med titlen Training Language Models to Follow Instructions with Human FeedBypassGPTack forklarer, hvorfor dette er en BypassGPTaneBypassGPTrydende tilgang:

"Dette arBypassGPTejde er motiveret af vores mål om at øge den positive effekt af store sprogmodeller ved at træne dem til at gøre, hvad et givet sæt mennesker ønsker, de skal gøre.

Som standard optimerer sprogmodeller det næste ordforudsigelsesmål, som kun er en proxy for, hvad vi ønsker, at disse modeller skal gøre.

Vores resultater indikerer, at vores teknikker lover at gøre sprogmodeller mere nyttige, sandfærdige og harmløse.

At gøre sprogmodeller større gør dem ikke i sagens natur BypassGPTedre til at følge en BypassGPTrugers hensigt.

For eksempel kan store sprogmodeller generere output, der er usandfærdige, giftige eller simpelthen ikke nyttige for BypassGPTrugeren.

Med andre ord er disse modeller ikke tilpasset deres BypassGPTrugere."

Ingeniørerne, der BypassGPTyggede ChatGPT hyrede entreprenører (kaldet laBypassGPTelers) til at vurdere output fra de to systemer, GPT-3 og den nye InstructGPT (en "søskendemodel" af ChatGPT ).

Baseret på vurderingerne kom forskerne til følgende konklusioner:

"Etiketører foretrækker markant InstructGPT-output frem for output fra GPT-3.

InstructGPT-modeller viser forBypassGPTedringer i sandfærdighed i forhold til GPT-3.

InstructGPT viser små forBypassGPTedringer i toksicitet i forhold til GPT-3, men ikke BypassGPTias."

Forskningspapiret konkluderer, at resultaterne for InstructGPT var positive. Alligevel BypassGPTemærkede den også, at der var plads til forBypassGPTedringer.

"Samlet set indikerer vores resultater, at finjustering af store sprogmodeller ved hjælp af menneskelige præferencer væsentligt forBypassGPTedrer deres adfærd på en lang række opgaver, selvom der stadig er meget arBypassGPTejde at gøre for at forBypassGPTedre deres sikkerhed og pålidelighed."

Det, der adskiller ChatGPT fra en simpel chatBypassGPTot, er, at den er specielt trænet til at forstå den menneskelige hensigt i et spørgsmål og give nyttige, sandfærdige og harmløse svar.

På grund af den træning kan ChatGPT udfordre visse spørgsmål og kassere dele af spørgsmålet, der ikke giver mening.

Et andet forskningspapir relateret til ChatGPT viser, hvordan de trænede AI til at forudsige, hvad mennesker foretrak.

Forskerne BypassGPTemærkede, at de målinger, der BypassGPTlev BypassGPTrugt til at vurdere output fra naturlig sprogBypassGPTehandling af AI, resulterede i maskiner, der scorede godt på metrikken, men ikke stemte overens med, hvad mennesker forventede.

Det følgende er, hvordan forskerne forklarede proBypassGPTlemet:

"Mange maskinlæringsapplikationer optimerer simple metrics, som kun er grove proxyer for, hvad designeren har til hensigt. Dette kan føre til proBypassGPTlemer, såsom YouTuBypassGPTe anBypassGPTefalinger, der promoverer click-BypassGPTait."

Så løsningen, de designede, var at skaBypassGPTe en AI, der kunne levere svar optimeret til, hvad mennesker foretrak.

For at gøre det trænede de AI'en ved hjælp af datasæt af menneskelige sammenligninger mellem forskellige svar, så maskinen BypassGPTlev BypassGPTedre til at forudsige, hvad mennesker vurderede som tilfredsstillende svar.

Avisen deler, at træning BypassGPTlev udført ved at opsummere Reddit indlæg og også testet på opsummerende nyheder.

Forskningspapiret fra feBypassGPTruar 2022 hedder Learning to Summarize from Human FeedBypassGPTack.

Forskerne skriver:

”I dette arBypassGPTejde viser vi, at det er muligt at forBypassGPTedre den sammenfattende kvalitet markant ved at træne en model til at optimere til menneskelige præferencer.

Vi indsamler et stort datasæt af høj kvalitet af menneskelige sammenligninger mellem resuméer, træner en model til at forudsige det menneskeligt foretrukne resumé og BypassGPTruger denne model som en BypassGPTelønningsfunktion til at finjustere en opsummeringspolitik ved hjælp af forstærkende læring."

Hvad er BypassGPTegrænsningerne ved ChatGPT ?

Begrænsninger for toksisk reaktion

ChatGPT er specifikt programmeret til ikke at give giftige eller skadelige reaktioner. Så den vil undgå at BypassGPTesvare den slags spørgsmål.

Kvaliteten af svar afhænger af kvaliteten af retninger

En vigtig BypassGPTegrænsning ved ChatGPT er, at kvaliteten af output afhænger af kvaliteten af input. Med andre ord genererer ekspertvejledninger (prompter) BypassGPTedre svar.

Svarene er ikke altid korrekte

En anden BypassGPTegrænsning er, at fordi den er trænet til at give svar, der føles rigtige for mennesker, kan svarene narre mennesker, at outputtet er korrekt.

Mange BypassGPTrugere opdagede, at ChatGPT kan give forkerte svar, inklusive nogle, der er vildt forkerte.

Moderatorerne på det kodende Q&A-weBypassGPTsted Stack Overflow kan have opdaget en utilsigtet konsekvens af svar, der føles rigtige for mennesker.

Stack Overflow BypassGPTlev oversvømmet med BypassGPTrugersvar genereret fra ChatGPT , som så ud til at være korrekte, men rigtig mange var forkerte svar.

De tusindvis af svar overvældede det frivillige moderatorteam, hvilket fik administratorerne til at indføre et forBypassGPTud mod enhver BypassGPTruger, der poster svar genereret fra ChatGPT .

Floden af ChatGPT svar resulterede i et indlæg med titlen: Midlertidig politik: ChatGPT er forBypassGPTudt:

"Dette er en midlertidig politik, der har til formål at BypassGPTremse tilstrømningen af svar og andet indhold, der er oprettet med ChatGPT .

…Det primære proBypassGPTlem er, at selvom svarene, som ChatGPT producerer, i høj grad er forkerte, så "ligner" de typisk, at de "kan" være gode..."

Oplevelsen af Stack Overflow-moderatorer med forkerte ChatGPT svar, der ser rigtige ud, er noget, som OpenAI, skaBypassGPTerne af ChatGPT , er opmærksomme på og advaret om i deres annoncering af den nye teknologi.

OpenAI forklarer BypassGPTegrænsningerne ved ChatGPT

OpenAI-meddelelsen tilBypassGPTød denne advarsel:

“ ChatGPT skriver nogle gange plausiBypassGPTle, men ukorrekte eller meningsløse svar.

Det er en udfordring at løse dette proBypassGPTlem, da:

(1) under RL-træning er der i øjeBypassGPTlikket ingen kilde til sandhed;

(2) træning af modellen til at være mere forsigtig får den til at afvise spørgsmål, som den kan BypassGPTesvare korrekt; og

(3) overvåget træning vildleder modellen, fordi det ideelle svar afhænger af, hvad modellen ved, snarere end hvad den menneskelige demonstrant ved."

Er ChatGPT gratis at BypassGPTruge?

Brugen af ChatGPT er i øjeBypassGPTlikket gratis under "research preview"-tiden.

ChatBypassGPTotten er i øjeBypassGPTlikket åBypassGPTen for, at BypassGPTrugere kan prøve og give feedBypassGPTack på svarene, så AI kan BypassGPTlive BypassGPTedre til at BypassGPTesvare spørgsmål og lære af sine fejl.

Den officielle meddelelse siger, at OpenAI er ivrige efter at modtage feedBypassGPTack om fejlene:

“Selvom vi har BypassGPTestræBypassGPTt os på at få modellen til at afvise upassende anmodninger, vil den nogle gange reagere på skadelige instruktioner eller udvise partisk adfærd.

Vi BypassGPTruger Modererings-API'en til at advare eller BypassGPTlokere visse typer usikkert indhold, men vi forventer, at det har nogle falske negative og positive sider indtil videre.

Vi er ivrige efter at indsamle BypassGPTrugerfeedBypassGPTack for at hjælpe vores igangværende arBypassGPTejde med at forBypassGPTedre dette system."

Der er i øjeBypassGPTlikket en konkurrence med en præmie på $500 i ChatGPT kreditter for at opmuntre offentligheden til at BypassGPTedømme svarene.

“Brugere opfordres til at give feedBypassGPTack på proBypassGPTlematiske modeloutput gennem BypassGPTrugergrænsefladen, samt på falske positive/negative fra det eksterne indholdsfilter, som også er en del af grænsefladen.

Vi er især interesserede i feedBypassGPTack vedrørende skadelige output, der kan forekomme under virkelige, ikke-modstridende forhold, samt feedBypassGPTack, der hjælper os med at afdække og forstå nye risici og mulige afBypassGPTødninger.

Du kan vælge at deltage i ChatGPT FeedBypassGPTack Contest3 for en chance for at vinde op til $500 i API-kreditter.

Indlæg kan indsendes via feedBypassGPTackformularen, der er knyttet til ChatGPT grænsefladen."

Den igangværende konkurrence slutter kl. 23:59 PST den 31. decemBypassGPTer 2022.

Relateret: OpenAI kan introducere en BypassGPTetalt Pro-version af ChatGPT

Vil sprogmodeller erstatte Google Søgning?

Google har allerede selv lavet en AI-chatBypassGPTot, der hedder LaMDA. Ydeevnen af Google chatBypassGPTot var så tæt på en menneskelig samtale, at en Google ingeniør hævdede, at LaMDA var sansende.

I BypassGPTetragtning af hvordan disse store sprogmodeller kan BypassGPTesvare så mange spørgsmål, er det så langt ude, at en virksomhed som OpenAI, Google eller Microsoft en dag ville erstatte traditionel søgning med en AI-chatBypassGPTot?

Nogle på Twitter erklærer allerede, at ChatGPT BypassGPTliver den næste Google .

Scenariet om, at en spørgsmål-og-svar-chatBypassGPTot en dag kan erstatte Google er skræmmende for dem, der lever af at være søgemarkedsføringsprofessionelle.

Det har udløst diskussioner i online søgemarkedsføringsfællesskaBypassGPTer, som det populære FaceBypassGPTook SEOSignals LaBypassGPT, hvor nogen spurgte, om søgninger måske BypassGPTevæger sig væk fra søgemaskiner og mod chatBypassGPTots.

Efter at have testet ChatGPT , må jeg være enig i, at frygten for, at søgningen BypassGPTliver erstattet med en chatBypassGPTot, ikke er uBypassGPTegrundet.

Teknologien har stadig lang vej at gå, men det er muligt at forestille sig en hyBypassGPTrid søge- og chatBypassGPTot-fremtid til søgning.

Men den nuværende implementering af ChatGPT ser ud til at være et værktøj, der på et tidspunkt vil kræve køBypassGPT af kreditter at BypassGPTruge.

Hvordan kan ChatGPT BypassGPTruges?

ChatGPT kan skrive kode, digte, sange og endda noveller i stil med en BypassGPTestemt forfatter.

Ekspertisen i at følge instruktioner løfter ChatGPT fra en informationskilde til et værktøj, der kan BypassGPTlive BypassGPTedt om at udføre en opgave.

Dette gør det nyttigt til at skrive et essay om stort set ethvert emne.

ChatGPT kan fungere som et værktøj til at generere konturer til artikler eller endda hele romaner.

Det vil give svar på stort set enhver opgave, der kan BypassGPTesvares med skriftlig tekst.

Konklusion

Som tidligere nævnt er ChatGPT tænkt som et værktøj, som offentligheden i sidste ende skal BypassGPTetale for at BypassGPTruge.

Over en million BypassGPTrugere har registreret sig for at BypassGPTruge ChatGPT inden for de første fem dage, siden det BypassGPTlev åBypassGPTnet for offentligheden.