Словарь терминов в сфере нейросетей и искусственного интеллекта

При изучении нейросетей вы часто будете сталкиваться с новыми терминами, которые вам так или иначе предстоит изучить, поэтому сохраните себе в заметки ссылку на данную статью — она вам пригодится.

Если какие-то термины будут вам непонятны на данном этапе, то вы сможете разобрать каждый из них подробнее в наших статьях, список которых находится по этой ссылке

Искусственный интеллект — технология, позволяющая компьютерам выполнять задачи, требующие человеческого интеллекта, такие как распознавание речи, обработка естественного языка, машинное обучение, принятие решений, генерация изображений, обработка фотографий и так далее.

Сильный искусственный интеллект — разновидность искусственного интеллекта, который обладает способностью к самосознанию, самообучению и решению сложных задач, сравнимых с человеческим интеллектом. Отличительной особенностью сильного ИИ является способность самостоятельно ставить себе задачи, обладая обоснованной мотивацией и целью для их исполнения. Этот вид интеллекта еще не создан, поэтому восстание машин человечеству пока не угрожает.

Нейросеть (НС) — компьютерная модель, вдохновленная структурой и функциями человеческого мозга, используемая для распознавания образов, текстов и обучения на основе этих данных. В разговорной речи этот термин часто используется наравне с "искусственным интеллектом", хотя имеет иное значение.

🚀 Приглашаем вас на бесплатное обучение по таким нейросетям, как ChatGPT, Stable Diffusion и Dalle-3.
Информация доступна по ссылке: ПОДРОБНЕЕ ПРО КУРС

Генеративная нейросеть — тип нейросети, который может генерировать новые данные после анализа и сопоставления обучающих данных. Например, нейросеть, создающая по текстовому описанию изображение, является генеративной.

Промпт — текстовый ввод или подсказка, используемая для инициирования определенного действия или реакции от искусственного интеллекта. Промпт — это текстовое описание, которое пользователь отправляет нейросети, чтобы получить от нее какой-то результат (статью, изображение и пр). Иначе "промпт" можно назвать "командой" для нейросети.

Негативный промпт — текстовое описание, которое предназначено для предотвращения определенного действия или реакции от искусственного интеллекта. Например, для нейросети Stable Diffusion добавление слова "red" в негативный промпт запретит ей использовать красный цвет при генерации изображений.

Токен — единица информации, используемая в обработке естественного языка, может представлять слово, символ или другой элемент данных. Как правило, 1 слово на английском языке = 1 токен, один пробел = 0 токенов, любой другой знак препинания = 1 токен. В нейросети ChatGPT все слова на русском языке занимают в несколько раз больше токенов, то же самое касается и слов на других языках, кроме английского.

"Сказочные" токены — это понятие, которое мы вводим для обозначения "токенов" сервисов, перепродающих услуги крупных компаний таких как Open Ai. Многие сервисы искажают значение слова "токен" чтобы ввести в заблуждение своих клиентов, иногда они делают стоимость 1 токена равным 1 символу, что является грубой подменой понятий. Как правило, они делают это, чтобы брать больше денег за свои услуги с клиентов, которые плохо разбираются в теме нейросетей.

Модель (чекпойнт) — сохраненное состояние нейросети или искусственного интеллекта, которое можно загрузить для восстановления или продолжения обучения. Например, каждая модель (чекпойнт) в нейросети Stable Diffusion будет генерировать изображения в разных стилях, будет знать разных персонажей и т.д.

Denoising strength (DenS) — параметр в некоторых моделях искусственного интеллекта, который определяет степень устранения шума из данных. Например, в Stable Diffusion параметр "DenS" определяет степень вмешательства в оригинал в режиме img2img, чем выше Denoising strength, тем сильнее будет изменен оригинал при преобразовании изображений.

img2img — широкое понятие в генеративных нейросетях, включающее в себя различные методы преобразования одного изображения в другое. Среди методов img2img можно выделить следующие: апскейл с дорисовкой недостающих пикселей, стилизация, Inpaint, OutPaint, Scetch и др.

CFG Scale (CFG) — параметр, определяющий степень приоритета промпта, введенного клиентом. Чем ниже CFG в Stable Diffusion, тем больше нейросеть будет прислушиваться к тому, что написано в промпте. Если CFG повысить, то нейросеть будет вносить больше "отсебятины", в т.ч. добавлять цвета, яркость и пр.

Сэмплер — математический алгоритм или метод, используемый для выборки и обработки данных при генерации новых результатов из распределения. Сэмплер в Stable Diffusion с математической точки зрения определяет то, как будет интерпретирован промпт клиента. Разные сэмплеры подходят для решения разных задач: повышение скорости генераций, повышение точности передачи, упрощение текстуры и пр.

DeepFace — алгоритм от Yes Ai, позволяющий делать замену и подстановку любых лиц на изображениях, которые создаются или модифицируются в нейросети Stable Diffusion.

ChatGPT — модель искусственного интеллекта, специализирующаяся на генерации текста и ведении диалогов, разработанная компанией OpenAI. Именно эта нейросеть в 2022 году дала сильнейший толчок для популяризации нейросетей среди широких масс.

Stable Diffusion (SD) — технология, использующая искусственный интеллект для генерации и модификации любых изображений. Эта нейросеть является самой быстро развивающейся за счет того, что весь исходный код является открытым, любой программист может присоединиться к процессу развития этой НС.

INPAINT — технология, использующая искусственный интеллект для заполнения пропущенных или поврежденных участков изображений. Инпейнт позволяет не только изменять части изображений, но и полностью переделывать их, из-за чего в сети стало появляться все больше дипфейков.

OutPaint — технология, использующая искусственный интеллект для расширения границ изображения путем генерации дополнительного контента. Допустим, что у вас есть исходная фотография размером 1024 x 1024 пикселя, outpaint способен расширить ее, додумав при этом недостающие элементы и окружение, основываясь на той части картинки, которую видит на оригинале. Так, например, из 1024х1024 можно без особых трудностей получить изображение с разрешением 1024х1600 пикселей.

LoRA (Low Rank Adaptation) — метод оптимизации для обучения нейросетей, который позволяет адаптировать модель с низким рангом параметров. Например, в нейросети Stable Diffusion модели "LoRA" позволяют научить SD рисовать существ или объекты в тех стилях, которые НС не знала в базовой используемой модели (чекпойнте). Также LoRA в SD позволяет расширить некоторые другие возможности, в частности, с ее помощью можно через весовые коэффициенты контролировать длину волос, цвет кожи и прочие детали персонажей.

ControlNet — архитектура нейросети, предназначенная для управления и координации различных элементов, например, на изображениях в Stable Diffusion. С помощью ControlNet можно создавать карты нормалей, глубины, позы и пр. На основе полученных карт можно генерировать новые изображения, например, с теми же позами у людей и животных, с похожими элементами интерьера и т.д.

Текстовые инверсии (Embeddings) — представления слов или фраз в многомерном пространстве, которые используются для обучения и работы моделей обработки естественного языка. Текстовые инверсии часто используются для упрощения процесса написания промптов и негативных промптов. Вес файлов текстовых инверсий намного меньше, чем вес моделей, но главным недостатком "эмбеддингов" является то, что они не способны генерировать на изображениях то, чего выбранная модель (чекпойнт) еще не знает.

LLM (Large Language Model) — большая модель обработки естественного языка, способная обрабатывать и генерировать текст на основе большого объема данных. По сути ChatGPT и ей подобные нейросети являются LLM — большими языковыми моделями.

Dalle — модель искусственного интеллекта, разработанная OpenAI, способная генерировать изображения на основе текстовых описаний. Ее особенностью (говорим про версии Dalle-3 и выше) является простота, высокая степень понимания прямой речи в промптах, умение писать текст прямо на изображениях, низкая вероятность искажений и мутаций рук.

SVD (Stable Video Diffusion) — технология, использующая искусственный интеллект для генерации видео из картинок. Особенность этой нейросети в том, что она является детективно-генеративной, то есть она сначала распознает, что именно изображено на исходной картинке (процесс детекции), а потом пытается задать этим объектам какие-то движения, не являющиеся спонтанными (генерация).

Наш сайт о нейросетях: https://yesai.su

Полный список статей о боте @yes_ai_bot находится по этой ссылке

Подробнее о сервисе Yes Ai рассказываем в этом коротком видео

Обзор возможностей, которые вам дают современные нейронные сети

Откройте для себя наш 👉 Форум об ИИ и нейронных сетях