OpenAI's U-vending: Uddanner ikke GPT-4 ud fra API-kundedata

openai-privatlivsændringer-6457d3fd3d25f-sej-760x400.png

I en betydelig ændring af sine tidligere metoder har OpenAI meddelt, at det ikke længere vil bruge kundadata, der sendes via sine API'er, til at træne sine omfattende sprogmodeller, som f.eks. GPT-4.

Ændringen blev bekræftet af Sam Altman, administrerende direktør for OpenAI, i en nylig interview med CNBC.

OpenAI's nye tilgang til brugerdata

OpenAI's ændring i politikken blev implementeret den 1. marts 2023, da virksomheden stille opdaterede sine servicevilkår for at afspejle dette nye engagement i brugernes privatliv.

Altman præciserede: "Kunderne ønsker tydeligvis ikke, at vi træner på deres data, så vi har ændret vores planer: Det vil vi ikke gøre."

API'er, eller applikationsprogrammeringsgrænseflader, er teknologiske rammer, der giver kunder mulighed for at forbinde direkte til OpenAI's software.

Altman udtalte, at OpenAI ikke har brugt API-data til modeltræning "i et stykke tid", hvilket antyder, at denne officielle meddelelse formaliserer en eksisterende praksis.

Implikationer for forretningskunder

OpenAI's skridt har vidtrækkende implikationer, især for sine forretningskunder, som inkluderer giganter som Microsoft, Salesforce og Snapchat.

Disse virksomheder er mere tilbøjelige til at udnytte OpenAI's API-funktionalitet til deres drift, så privatlivets og databeskyttelsens skift er særligt relevant for dem.

Dog gælder de nye datasikkerhedsforanstaltninger kun for kunder, der benytter virksomhedens API-tjenester. OpenAI's opdaterede servicevilkår bemærker: "Vi kan bruge indhold fra tjenester, der ikke er vores API."

Sådanne former for dataindtastning, som f.eks. tekst indtastet i den populære chatbot ChatGPT, kan stadig anvendes af OpenAI, medmindre data deles gennem API'en.

Bredere Industriel Indflydelse

OpenAIs politikskift kommer på et tidspunkt, hvor industrier kæmper med de potentielle konsekvenser af store sprogmodeller, såsom OpenAIs ChatGPT, der erstatter materiale, der traditionelt er skabt af mennesker.

For eksempel begyndte Forfatterforeningen i Amerika for nylig at strejke, efter at forhandlingerne mellem Forfatterforeningen og filmstudierne brød sammen. Forfatterforeningen havde argumenteret for begrænsninger i brugen af OpenAI's ChatGPT til manuskriptgenerering eller omskrivning.

OpenAI's beslutning om ikke at bruge kundedata til træning markerer et afgørende øjeblik i den igangværende samtale om datasikkerhed og AI. Mens virksomheder fortsætter med at udforske og udfordre grænserne for AI-teknologi, vil det sandsynligvis forblive centralt i disse diskussioner at sikre brugernes privatliv og opretholde tilliden.

Udviklingen af ChatGPT: GPT-3 til GPT-4

Det er vigtigt at bemærke, at OpenAIs forpligtelse til ikke at bruge kundedata til træning gælder for deres seneste sprogmodel, GPT-4, udgivet den 14. marts 2023.

GPT-4 introducerede flere forbedringer i forhold til sin forgænger, GPT-3, herunder en betydelig stigning i ordgrænsestørrelse (25.000 i forhold til ChatGPT's 3.000-ordsgrænse), større kontekstvinduesstørrelse og forbedrede reasoning- og forståelsesfærdigheder.

En anden bemærkelsesværdig funktion ved GPT-4 er dens multimodalitet, eller evnen til at forstå og slutte information ud fra billeder udover tekst. Denne seneste model genererer mere menneskelignende tekster ved at bruge funktioner som emojis for en mere personlig følelse.

Ikke desto mindre forbliver den præcise størrelse og arkitektur af GPT-4 hemmelig, hvilket fører til spekulationer om detaljerne i modellen.

Trods disse rygter har OpenAIs CEO benægtet konkrete påstande om modellens størrelse.

Vedrørende ydeevnen har GPT-4 vist styrker i tekstgenerering, men også visse begrænsninger. For eksempel fik den en score i den 54. percentil på Graduate Record Examination (GRE) i Skrivning og placerede sig i den 43. - 59. percentil på AP Calculus BC-eksamen.

Derudover klarede den sig godt med lette Leetcode kodningsopgaver, men dens præstation faldt med stigende opgavesværhedsgrad.

Selvom detaljerne i GPT-4's træningsproces ikke er dokumenteret officielt, er det kendt, at GPT-modeller generelt involverer maskinlæring i stor skala med en mangfoldig række internettekst.

Forventninger

Som følge af ændringer i OpenAI's databrugspolitik inkluderer dataene, der bruges til træning af deres sprogmodeller, ikke information, der deles via API'en, medmindre brugere udtrykkeligt accepterer at bidrage med det til dette formål.

Mens denne teknologi forbedres og spiller en vigtigere rolle i vores liv, er det interessant, hvordan virksomheder drejer sig og reagerer på bekymringer om at beskytte data privatliv og vinde tillid fra folk.

OpenAI's U-Turn: Ikke at træne GPT-4 på API kundedata

OpenAI's nye tilgang til brugerdata

Implikationer for forretningskunder

Bredere Industriel Indflydelse

Udviklingen af ChatGPT: GPT-3 til GPT-4

Forventninger

Relaterede Artikler