Meta Platforms META-Q wykorzystywała publiczne posty na Facebooku i Instagramie do szkolenia części swojego nowego wirtualnego asystenta Meta AI, ale wykluczyła prywatne posty udostępniane wyłącznie rodzinie i znajomym, starając się szanować prywatność konsumentów, powiedział agencji Reuters dyrektor ds. polityki firmy oświadczenie. wywiad.
Meta nie wykorzystywała również prywatnych czatów w swoich usługach komunikacyjnych jako danych szkoleniowych dla modelu i podjęła kroki w celu odfiltrowania prywatnych szczegółów z publicznych zbiorów danych wykorzystywanych do szkolenia, powiedział Nick Clegg, szef ds. spraw globalnych w Meta, przemawiając na marginesie corocznego sprawozdania firmy Połącz konferencję. w tym tygodniu.
„Próbowaliśmy wykluczyć zbiory danych zawierające głównie dane osobowe” – powiedział Clegg, dodając, że „zdecydowana większość” danych Meta wykorzystanych do szkoleń była publicznie dostępna.
Jako przykład strony internetowej podał LinkedIn, z którego treści Meta celowo nie korzystała ze względu na obawy dotyczące prywatności.
Komentarze Clegga pojawiają się po tym, jak firmy technologiczne, w tym Meta, OpenAI i Google należący do Alphabet, zostały skrytykowane za wykorzystywanie informacji uzyskanych z Internetu bez pozwolenia do szkolenia swoich modeli sztucznej inteligencji, które pochłaniają ogromne ilości danych w celu podsumowania informacji i tworzenia obrazów.
Firmy zastanawiają się, jak postępować z materiałami zastrzeżonymi lub chronionymi prawem autorskim wyładowanymi w trakcie procesu oraz z możliwością reprodukcji ich systemów sztucznej inteligencji, ponieważ stają w obliczu pozwów ze strony autorów, którzy oskarżają je o naruszenie praw autorskich.
Meta AI była najważniejszym produktem spośród pierwszych narzędzi AI skierowanych do konsumentów, zaprezentowanych przez dyrektora generalnego Marka Zuckerberga w środę podczas corocznej konferencji produktowej Meta Connect. W przeciwieństwie do poprzednich konferencji, które skupiały się na rzeczywistości rozszerzonej i wirtualnej, tegoroczne wydarzenie zdominowały dyskusje na temat sztucznej inteligencji.
Meta powiedziała, że asystent wykorzystuje niestandardowy model oparty na potężnym modelu dużego języka Llama 2, który firma wprowadziła do ogólnego użytku biznesowego w lipcu, a także nowy model o nazwie Emu, który generuje obrazy w odpowiedzi na podpowiedzi tekstowe.
Produkt będzie w stanie generować tekst, dźwięk i obrazy oraz będzie miał dostęp do informacji w czasie rzeczywistym dzięki współpracy z wyszukiwarką Bing firmy Microsoft.
Clegg powiedział, że publiczne posty na Facebooku i Instagramie, które wykorzystano do szkolenia Meta AI, zawierały tekst i obrazy.
Rzecznik Meta powiedział agencji Reuters, że posty te posłużyły do szkolenia Emu w zakresie elementów generowania obrazu w produkcie, natomiast funkcje czatu opierały się na Llama 2 z dodatkiem kilku publicznie dostępnych zbiorów danych z adnotacjami.
Rzecznik powiedział, że interakcje z Meta AI można również wykorzystać do ulepszenia funkcji w przyszłości.
Meta nałożyła ograniczenia bezpieczeństwa na treści, które może tworzyć narzędzie Meta AI, takie jak zakaz tworzenia realistycznych obrazów osób publicznych, powiedział Clegg.
Jeśli chodzi o materiały chronione prawem autorskim, Clegg powiedział, że spodziewa się „sporo postępowań sądowych” w kwestii, „czy treści twórcze są objęte istniejącą doktryną dozwolonego użytku”, która pozwala na ograniczone wykorzystanie chronionych dzieł do celów takich jak komentowanie i badania. I parodie.
„Wierzymy, że tak jest, ale mocno wątpimy, czy będzie to miało wpływ na procesy sądowe” – powiedział Clegg.
Niektóre firmy dysponujące narzędziami do generowania obrazów ułatwiają odtworzenie znanych postaci, takich jak Myszka Miki, inne zaś zapłaciły za materiały lub celowo unikały uwzględniania ich w danych szkoleniowych.
Na przykład OpenAI podpisało tego lata sześcioletnią umowę z dostawcą treści Shutterstock na korzystanie z firmowych bibliotek zdjęć, wideo i muzyki do celów szkoleniowych.
Zapytany, czy Meta podjęła takie kroki, aby uniknąć powielania obrazów chronionych prawem autorskim, rzecznik Meta wskazał na nowe warunki świadczenia usług, które uniemożliwiają użytkownikom tworzenie treści naruszających prywatność i prawa własności intelektualnej.
„Zła entuzjasta podróży. Irytująco skromny ćpun internetu. Nieprzepraszający alkoholiczek”.