October 14, 2023

Регулировать обучение ИИ нельзя, Нарушение авторских прав - миф

Похоже мы ещё ой как долго будем смотреть за появлением и развитием инструментов для защиты от нейросетей. Регулирование источников обучения беспокоит каждого встречного-поперечного, ибо они прекрасно знают, что по закону могут требовать оплаты за использование написанного ими материала.

Вот только эти идиоты всё никак не поймут, что здесь нельзя мыслить теми же категориями, что и в обычных инструментах.

Человек не платит каждому сайту за новую информацию, за открытие слов или событий, о которых он ещё не знал. Он не платит прошедшему мимо человеку, потому что услышал часть его разговора и ему понравилась его фраза, которой он теперь тоже будет пользоваться. Мы не платим каждому художнику в картинной галерее за то, что посмотрели на все его картины, и как компиляция, придумали интересный образ.

Я могу пройтись по улице и увидеть странное дерево, а потом через несколько месяцев в интернете наткнуться на абстрактную картинку, похожую на то дерево, и в итоге создам в голове новую идею, И Я НИКОМУ НЕ ДОЛЖЕН ЗА ЭТО ОТПЛАЧИВАТЬ ИЛИ ОТЧИТЫВАТЬСЯ, КАК ТАК ПОЛУЧИЛОСЬ, ПОТОМУ ЧТО САМ ЭТОГО НЕ ЗАМЕЧУ. Мы накапливаем информацию годами, вокруг нас огромное количество всяческой информации, и человек всегда и везде будет её подмечать и запоминать. Разве такое получится контролировать? Вы сможете вести список каждого прошедшего рядом с вами события или каждой увиденной буквы? Ваши ощущения на улице и дома, вкус каждой еды в каждый момент времени?

"Херню какую-то несёшь, не собираюсь я всё это записывать и учитывать и отплачивать даже если б смог", так машинное обучение именно так и работает! Она собирает огромное количество информации, и дальше по написанным алгоритмам использует её для обучения (естественно общими словами говорю), как и наши мозги. Нейросеть не думает при выполнении запроса категориями "Описание запрошенной картины очень похоже на постоянство памяти Сальвадора Дали, значит я под копирку срисую, меняя отдельные детали", она смотрит прогоняет в мат аппарате хрен знает сколько и каких параметров, которые получились в результате обработки всего массива при обучении.

Знаю, что прозвучит нелогично, тут надо подумать, но нейросеть не запоминает ничего из того, на чём она училась. Она делает выводы на основе обучения и запоминает только эти выводы. Ни байта ваших картин, текстов, видео, голоса она не берёт (речь про генерацию универсальных ответов на универсальные запросы. Нейросети, заточенные например под копирование голоса к ним не относятся, это вообще другой разговор). Похоже на человека, не правда ли? С котором пару абзацев выше мы пришли к выводу, что нельзя вести список источников обучения. Дело не в огромном числе этих источников, а что это в принципе глупая и бессмысленная затея.

На этом у меня всё. Подписывайтесь на телеграм, ютуб, твич, всем пока!