Zmiana kursu OpenAI: Nie trenowanie GPT-4 na podstawie danych klientów API

zmiany_w_polityce_prywatnosci_openai-6457d3fd3d25f-sej-760x400.png

W istotnym odejściu od dotychczasowej praktyki, OpenAI ogłosiło, że nie będzie już wykorzystywać danych klientów przesyłanych za pośrednictwem swoich interfejsów API do szkolenia swoich rozbudowanych modeli językowych, takich jak GPT-4.

Zmianę potwierdził Sam Altman, dyrektor generalny OpenAI, podczas niedawnej rozmowy z CNB.

Nowe podejście OpenAI do danych użytkownika

Zmiana polityki OpenAI została wprowadzona 1 marca 2023 roku, kiedy firma cicho zaktualizowała swoje warunki korzystania, aby odzwierciedlić to nowe zobowiązanie do prywatności użytkowników.

Altman wyjaśnił: „Klienci jednoznacznie chcą, abyśmy nie szkolili się na ich danych, dlatego zmieniliśmy nasze plany: nie będziemy tego robić.”

APIs, czyli interfejsy programowania aplikacji, to technologiczne struktury umożliwiające klientom bezpośrednie połączenie z oprogramowaniem OpenAI.

Altman stwierdził, że OpenAI nie korzystał z danych API do trenowania modelu "od jakiegoś czasu", co sugeruje, że to oficjalne ogłoszenie formalizuje istniejącą praktykę.

Implikacje dla klientów biznesowych

Ruch OpenAI ma dalekosiężne implikacje, zwłaszcza dla swoich klientów biznesowych, wśród których znajdują się giganci tak jak Microsoft, Salesforce i Snapchat.

Te firmy mają większą szansę skorzystać z możliwości API OpenAI do swoich operacji, dlatego zmiana prywatności i ochrony danych jest dla nich szczególnie istotna.

Jednakże nowe środki ochrony danych dotyczą wyłącznie klientów korzystających z usług API firmy. Zaktualizowane warunki korzystania z usługi OpenAI stwierdzają: „Możemy używać treści z usług innych niż nasze API.”

W związku z tym, inne formy wprowadzania danych, takie jak tekst wprowadzany do popularnego chatbota ChatGPT, mogą być nadal wykorzystywane przez OpenAI, chyba że dane są udostępniane za pośrednictwem interfejsu API.

Szeroki wpływ na branżę

Decyzja OpenAI wywołuje dyskusje w branżach, które borykają się z potencjalnym wpływem dużych modeli językowych, takich jak ChatGPT OpenAI, zastępujących treści tradycyjnie tworzone przez ludzi.

Na przykład, niedawno Writers Guild of America rozpoczął strajk po zerwaniu negocjacji między Gildią a wytwórniami filmowymi. Gildia opowiadała się za wprowadzeniem ograniczeń dotyczących używania ChatGPT od OpenAI do generowania scenariuszy lub ich przepisywania.

Decyzja OpenAI o niekorzystaniu z danych klientów w procesie szkolenia stanowi punkt zwrotny w trwających dyskusjach na temat prywatności danych i sztucznej inteligencji. W miarę jak firmy dalej eksplorują i posuwają się do granic technologii AI, zapewnienie prywatności użytkowników i utrzymanie zaufania prawdopodobnie pozostaną w centrum tych dyskusji.

Ewolucja ChatGPT: GPT-3 do GPT-4

Warto zauważyć, że zobowiązanie OpenAI do niekorzystania z danych klientów do treningu dotyczy najnowszego modelu językowego GPT-4, wydanego 14 marca 2023 roku.

GPT-4 wprowadził kilka ulepszeń w porównaniu do swojego poprzednika, GPT-3, w tym znaczny wzrost limitu słów (25 000 w porównaniu do limitu 3000 słów w ChatGPT), większy rozmiar okna kontekstu oraz poprawione umiejętności rozumienia i wnioskowania.

Inną wartościową cechą GPT-4 jest jego wielo-modalność, czyli zdolność do rozumienia i wnioskowania na podstawie obrazów, oprócz tekstu. Ten najnowszy model generuje bardziej ludzkie teksty, wykorzystując funkcje takie jak emotikony, co nadaje im bardziej spersonalizowany charakter.

Jednak dokładny rozmiar i architektura GPT-4 pozostają nieujawnione, co prowadzi do spekulacji na temat szczegółów tego modelu.

Pomimo tych plotek, CEO OpenAI zdementował konkretne twierdzenia dotyczące rozmiaru modelu.

Jeśli chodzi o wydajność, GPT-4 ma demonstrowane zalety w generowaniu tekstu, ale także pewne ograniczenia. Na przykład uzyskał wynik w 54. percentylu na Egzaminie Graduate Record Exam (GRE) Writing i osiągnął wynik w 43. - 59. percentylu na egzaminie AP Calculus BC.

Ponadto, dobrze poradził sobie z łatwymi zadaniami kodowania na platformie Leetcode, ale jego wyniki pogarszały się wraz z wzrostem trudności zadań.

Podczas gdy szczegóły dotyczące procesu szkolenia GPT-4 nie są oficjalnie udokumentowane, wiadomo, że modele GPT zazwyczaj korzystają z dużo skali uczenia maszynowego za pomocą zróżnicowanego zakresu tekstu internetowego.

Wyczekując

W wyniku zmian w polityce użytkowania danych OpenAI, dane używane do szkolenia swoich modeli językowych nie zawierają informacji udostępnianych za pośrednictwem interfejsu API, chyba że użytkownicy wyraźnie zgodzą się przekazać je w tym celu.

Podczas gdy ta technologia się rozwija i odgrywa coraz większą rolę w naszym życiu, interesujące jest, w jaki sposób firmy zmieniają kurs i odpowiadają na obawy dotyczące zachowania prywatności danych i zyskania zaufania ludzi.

OpenAI's zwrot: Nie uczenie GPT-4 na podstawie danych klienta API

Nowe podejście OpenAI do danych użytkownika

Implikacje dla klientów biznesowych

Szeroki wpływ na branżę

Ewolucja ChatGPT: GPT-3 do GPT-4

Wyczekując

Powiązane artykuły