"Дай под зад диплому" #4: Метрология в современных технологиях устарела и не нужна или востребована как никогда? Принцип релятивизма в метрологии

Недавняя новость: "Open AI представила Voice Engine для преобразования текста в голос". Выдержка с новости:

Voice Engine способна скопировать голос любого человека на основе всего лишь 15-секундной записи.

На любое подозрение о возможности создавать фейки благодаря генеративным сетям можно ответить "появится ответная нейросеть-детектор". Но я начинаю думать, что скорость создания противодействия и средств безопасности сильно отстаёт от имитации чего угодно с сумасшедшей правдоподобностью. Я только что загуглил распознавание искусственного голоса — нашёл лишь статью Хабра по собственному распознаванию и методологии, но не готовый инструмент. Зато вся остальная страница была забита подборками "лучших нейросетей для генерации речи".

Это лишь пролог с реальным примером, и мы вернёмся к нему в конце.

Метрология — наука, про которую многие позабыли, к сожалению. В моём вузе она есть, но преподаётся доисторическая, со времён Менделеева. Саму идею и смысл метрологии никто не передал. Кроме последнего лектора с его книгой "Принцип релятивизма в метрологии систем связи". И уже там я увидел одну из элементарнейших вещей, о которой, сука, никто и слова не сказал из всего преподавательского состава, но которая в разы важнее любой лабораторной работы по измерению напряжения и работе с советским осциллографом.

Инженерная технология начинается с измерений, т.е. абсолютно всегда измерения предшествуют самой технологии.

Логично? Логично. Просто? Просто. И что тут такого важного? Что зная и понимая метрологию, вы знаете будущее технологий. То, чем метрология занимается, и есть будущая технология, ибо не может появиться технология без измерений, а чтобы что-то измерить, надо придумать, как это измерить. А это уже и есть один из главных вопросов и объектов изучения метрологии.

Современная метрология исповедует принцип релятивизма — относительности методов измерений и стандартов качества для каждой отдельно взятой услуги, её пользователей и местоположения. К сожалению, также, как в СССР, когда всё везде одинаковое (да и ещё раньше или в других странах, не важно) у нас не получится вести дела. "Померим сигнал-шум, дабы нормально связь шла, и сравним с показателем для этого кабеля из ГОСТа", этого хватит только для протекающего электричества, на физическом уровне. Но есть загвоздка: вспомните-ка модель OSI... Сколько там уровней? СЕМЬ!!!

Физический первый, а дальше что, призраки, фантомы? С ними то что делать, там как измерять? Поебать мне, что отношение сигнал-шум хорошее, ладно, электрический сигнал доходит до получателя, а как мерить остальное? Методички по метрологии и ГОСТы ответа дать не могут. Один из признаков, что пора менять саму парадигму — это закономерное появления и существование вот таких аномалий, которая текущая парадигма объяснить не может. В данном случае мы сталкиваемся с тем, что современная метрология не способна работать с абсолютно всем комплексом IT и пакетной сетью, а именно они охватывают на данный момент всю нашу сеть и современные технологии.

Релятивизм — и есть та самая новая парадигма. Неважно, интернет или компьютерная техника — мы движемся к концепции "один универсальный вход и много суперперсонализированных услуг". В какой-то степени мы коснулись этого в прошлый раз, так как виртуализация тоже сюда подходит — один источник ко многим услугам. У старой метрологии по одному источнику шла конкретная услуга, не нужно было париться, а тут их мало того, что много, так ещё и пакетная сеть появляется, которая в одном потоке может полный спектр всего разнообразия услуг вместить.

Вместе с пакетной сетью прилетает и убийство распределения вероятностей, на которую также опиралась старая метрология. Математическое ожидание, дисперсия — пакетная сеть превращает измерения этих показателей в белый шум. Она масштабируется и имеет свойства самоподобия (сеть внутри сети, и их устройство или одинаково, или похоже), то есть мы говорим о фрактальном характере.

Знакомьтесь, Канторово множество. Самая удачная попытка математически описать пакетные сети: поиск ошибки среди дейтаграмм посредством уменьшения длины пакета и проверки каждого. С таким поверхностным описанием напоминает бинарный поиск, но это не совсем то, а углубляться не будем, это слишком обширная тема, так ещё и с математикой.

Важно другое — мы только что рассмотрели, как сильно отличается поведение и измерения технологий в прошлом и сейчас. Такая громадная разница объясняет запутанность и непонятность в метрологии прошлого и будущего. Метрология умирает, потому что не все понимают и вообще осознают эту проблему, а кто-то даже верит в работоспособность старой метрологии (значит эти люди не вылезали в свет или не готовы принять реальность).

"Так и что же нам с этой проблемой? Всякой мешуры непонятной нагнал, даже математику сюда приплёл, ты в начале вообще про нейросеть написал". Ещё раз вспомним постулат метрологии.

Инженерная технология начинается с измерений, т.е. абсолютно всегда измерения предшествуют самой технологии.

Одно из качеств, о котором я кричу последние два года в постах телеграма и видео на ютубе — безопасное использование нейросетей. Авторское право и deepfake неуклонно преследуют почти все мои темы. Со мной солидарен конгресс США, Европарламент и ГосДума, чьи идеи и законы мы также упоминаем в новостях о нейросетях. Они пытаются ответить на довольно сложный вопрос — как нам прийти к использованию генеративных сетей и обезопасить себя от сопровождающих это использование угроз?

И приходится уделять этому всё больше внимания не из-за отсутствия стандартов для производителей, а потому что производители хуй класть хотели на эту безопасность. Чем детские ножницы отличаются от обычных? Они куда тупее (не дети, а ножницы), поэтому ими сложнее порезаться. Вопрос безопасного использования можно и нужно рассматривать ещё на этапе создания нейросети, и разработчики могут ввести параметр "Возможность использования deepfake" например. Скорее всего, он и так есть, но им недостаточно руководствуются.

Кульминация: если бы метрологи перешил на современную релятивистскую парадигму или если бы о ней знали разработчики, то перед созданием любой нейросети по генерации голоса сначала бы появлялся инструмент по распознаванию сгенерированного голоса.

Ничего не напоминает формулировка? Я и третий раз напишу.

Инженерная технология начинается с измерений, т.е. абсолютно всегда измерения предшествуют самой технологии.

А теперь из кульминации.

Перед созданием генеративной нейросети должен появиться инструмент по распознаванию сгенерированной информации.

К сожалению, второе сделать сложнее и нарушить проще, чем первое. Но последствия такие же лавинообразные. В волне хайпа ChatGPT3.5 только спустя время появились ответные нейросети по распознаванию сгенерированного текста, и то, это были сторонние разработчики, а не разработчики OpenAI. Картина повторяется. Скорее всего, пока не случится какой-то глобальной катастрофы, связанной с таким похуистичным отношением, до создателей генеративных сетей не достучаться.

А как я сделал такой вывод, нашёл ответ на поставленный вопрос (безопасное использование нейросети) и дал прогноз на ближайшее будущее? Изучив технологии в текущей точке времени с позиции релятивисткой метрологии. Думаю, после прочтения этого материала, ответ на вопрос в названии статьи очевиден.

Если есть, чем дополнить, то можете написать в комментариях тг. Что это за рубрика и для чего она, я рассказываю здесь. Подписывайтесь на телеграм с постами и статьями, ютуб канал с обычными крупными и новостными видео, ютуб шортс с вертикальными видео и ютуб для IT стримов. Всем пока, до следующий статей.