Використання контенту YouTube для навчання ШІ
Google активно застосовує відео з бібліотеки YouTube для навчання своїх моделей штучного інтелекту, таких як Gemini та Veo 3, генератор відео й аудіо. Про це повідомляє CNBC, посилаючись на джерела. За словами одного з них, для тренування використовується вибірка з 20 млрд роликів.
Підтвердження від Google
У Google підтвердили цю інформацію, уточнивши, що йдеться лише про частину контенту, яка використовується відповідно до угод із творцями та медіакомпаніями. Представник YouTube наголосив, що компанія завжди використовувала власний контент для вдосконалення сервісів, і поява генеративного ШІ не змінила цього підходу. "Ми усвідомлюємо важливість захисту прав творців, тому розробили надійні механізми для їхньої безпеки", – заявили в компанії.
Занепокоєння експертів
Однак експерти висловлюють занепокоєння щодо можливих порушень авторських прав. Вони вважають, що використання відео без відома авторів для тренування ШІ може призвести до кризи у сфері інтелектуальної власності. Хоча YouTube стверджує, що повідомляв про це раніше, більшість творців не знали про використання їхнього контенту.
Обсяги використання контенту
Google не розкриває точну кількість відео, використаних для навчання моделей. Проте навіть якщо це лише 1% бібліотеки, це становить понад 2,3 млрд хвилин контенту – у 40 разів більше, ніж у конкурентів. Завантажуючи відео, творці надають YouTube широкі права на використання їхнього контенту. Однак можливості відмовитися від використання своїх роликів для тренування моделей Google немає.
Позиція організацій захисту прав
Організації, що захищають цифрові права, зазначають, що праця творців використовується для створення ШІ без їхньої згоди чи компенсації. Наприклад, сервіс Trace ID від компанії Vermillio показує, що деякі ШІ-ролики мають до 90% схожості з оригінальним контентом. Деякі автори не проти використання їхнього контенту для навчання ШІ, бачачи в цьому нові творчі можливості. Проте більшість вважають, що процес непрозорий і потребує чіткішого регулювання.
Угода з Creative Artists Agency
YouTube уклав угоду з Creative Artists Agency для розробки системи управління ШІ-контентом, що імітує відомих осіб. Однак механізми виявлення та видалення схожого контенту залишаються недосконалими. У США вже лунають пропозиції створити юридичний захист, який дозволив би авторам контролювати використання їхніх творів у сфері генеративного ШІ.
Контекст розвитку технологій
У квітні Google випустив відеогенератор Veo 2, на базі ШІ-бота Gemini. Ця модель здатна перетворювати текстові запити на 8-секундні відеоролики. Veo 2 створює відео у форматі MP4 з роздільною здатністю 720p та співвідношенням сторін 16:9. Наразі функціонал обмежується генерацією тексту у відео, але Google планує розширити можливості у майбутніх оновленнях. Кожне відео, створене Veo 2, містить цифровий водяний знак SynthID, вбудований у кожен кадр, що позначає його як продукт штучного інтелекту.
Згідно з інформацією Forbes, ця ситуація викликає серйозні питання щодо етики та законності використання контенту в епоху швидкого розвитку технологій штучного інтелекту.