Теория | Про AI простыми словами
June 24

Урок 2 «Основные понятия в AI» 

👩‍🏫 Автор урока: Анна Веклич, эксперт в сфере развития и продвижения высшего образования и науки, сооснователь @GPT4Telegrambot и автор курса «Нейрограмотность».

📌 В этом уроке вы узнаете основные термины, поймете, как они связаны между собой, почему самые умные нейросети в мире не знают, какое сегодня число, а также какие бывают нейросети.

Содержание конспекта

AI-пирамида или что есть что в мире AI?

Урок пройдет в формате от общего к частному. Для наглядной демонстрации, мы подготовили схему, которую разберем по частям сверху-вниз. И начнем мы с самого фундамента – компьютерных наук. Именно благодаря развитию этой сферы сегодня люди могут создавать искусственный интеллект. Давайте же поймем как?

1 ступень – Компьютерные науки

📌 Компьютерные науки – это науки, которые изучают методы и процессы сбора, хранения, обработки, передачи, анализа и оценки информации с использованием компьютерных технологий (информация + компьютер).

Появились они более 80 лет назад в период создания первого компьютера известным немецким инженером Конрадом Цузе в 1938 году.

Широкое распространение получили в 1950-х – 1960-х годах, а начиная с 2000-х именно эта сфера стала ТОП-1 по скорости развития и популярности (да-да, все захотели работать в ИТ и быть высокооплачиваемыми программистами).

Компьютерные науки изучают такие сферы, как:

2 ступень – Искусственный интеллект (AI)

Итак, AI – это один из разделов компьютерных наук. И, возможно, самый популярный на сегодняшний день. В предыдущем уроке мы уже дали определение этому термину. Давайте его еще раз зафиксируем.

📌 Искусственный интеллект – это компьютерные программы, цель которых имитировать интеллектуальные способности человека, обучаясь на большом количестве данных.

AI может:

  • общаться с людьми на их родном языке (естественном языке)
  • создавать уникальное (дизайн, видео, текстовая информация и др.)
  • принимать решения (какой шаг сделать в шахматах, покере, шашках и др.)
  • управлять процессом или объектом (автопилоты)
  • предсказывать (продажи, погоду, заболевания)
  • обучаться новому (владеть актуальной информацией, совершенствовать свои знания) и др.

Для пользователей искусственный интеллект может выглядеть в виде системы управления автомобилем, сайта, онлайн-переводчика, мобильного приложения, голосового помощника или чат-бота в Telegram.

Также мы с вами знаем, что существует два основных типа AI – генеративный (для создания текстов, картинок, видео, музыки) и не генеративный (который работает с распознаванием, предсказанием, рекомендациями, диагностикой и др.).

AI создают программисты, инженеры, дата-сайентисты и другие. Все, что мы сейчас с вами слышим про AI и чем будем учиться пользоваться на курсе «Нейрограмотность» – относится к понятию генеративный AI.

Например: ChatGPT, Claude 3, Midjourney, DALL-E 3, Suno AI, Sora и др.

3 ступень – Машинное обучение (ML)

AI можно создавать десятками разных способов. Один из самых популярных подходов – это «Машинное обучение», МО (Machine Learning, ML). Именно благодаря МО программы становятся «умными».

Иллюстрация создана нейросетью Midjourney в @GPT4Telegrambot /imagine нарисуй машинное обучение, чтобы компьютерная программа могла имитировать интеллект человека

Чтобы компьютерная программа могла имитировать интеллект человека, общаться и вести себя как мы, необходимо ее этому научить. То есть дать много данных о нашем мире и написать специальный алгоритм, который позволит программе учиться самой, без постоянного привлечения человека.

📌 Машинное обучение – это создание специальных алгоритмов, которые позволяют компьютерным программам самостоятельно учиться на больших объемах данных без постоянного вмешательства человека.

Формула машинного обучения может выглядеть так:


Машинное обучение = 1) Данные + 2) Специальный алгоритм + 3) Автоматическая работа программы


Давайте разберем ее подробнее.

1 элемент – данные / Big Data

В процессе машинного обучения в компьютерную программу загружается очень много информации (Big Data).

Иллюстрация создана нейросетью Midjourney в @GPT4Telegrambot /imagine очень много информации (Big Data), которая по стрелке загружается в компьютер --ar 16:9

📌 Это миллиарды, триллионы единиц контента (новости, картинки, интернет-страницы из всех открытых источников, документы, книги, звуки)

И от того, какая цель у AI, зависит, что именно нужно загружать.

📌 Отобранную подходящую информацию называют датасетами.

От качества этих данных зависит качество ответов от AI-программы. Поэтому так важно сразу определить источники информации, на которых будет учиться программа. При этом, чтобы не нарушить права авторов (художников, писателей, певцов).

Иллюстрация создана нейросетью Midjourney в @GPT4Telegrambot /imagine роботы сидят читают книги и газеты --style raw --ar 16:9

Например, если вы всегда читаете только желтую прессу, то ваш словарный запас будет состоять из определенных слов и оборотов этого стиля (потому что вы «загружали» такие тексты и стиль в свой мозг). То же происходит и с нейросетями, только в бОльшем масштабе. Качество ответов нейросетей зависит от качества и количества данных, на которых они учились.


Также у данных есть определенный срок годности и актуальности. Разработчики загружают информацию с определенной периодичностью. Например, раз в три месяца или раз в полгода.

Поэтому часть информации (новые факты, новости и события) во многих известных моделях нейросетей типа ChatGPT или Claude 3 просто отсутствует. А новые данные в них еще не успели загрузить.


Например, если модель GPT-4 обучена на данных о мире до декабря 2023 года, то, без выхода в Интернет, на вопрос «какое сегодня число» (27 апреля 2024) или «расскажи новости за прошедшую неделю», она не может ответить корректно. Теперь понимаете почему?


По этой же причине нейросети типа ChatGPT и Claude 3 не могут точно ответить на вопрос о том, кто вы, если вы пишете свое имя и фамилию (если вы, конечно, не Леонардо Дикаприо). О вас просто недостаточно информации в тех источниках, на которых училась нейросеть. Это отличает нейросети от традиционных поисковиков, типа Google. Об этом мы писали в предыдущем уроке.

2 элемент – специальный алгоритм / «рецепт»

Иллюстрация создана нейросетью Midjourney в @GPT4Telegrambot /imagine книга рецептов по созданию роботов

Машинное обучение = 1) Данные + 2) Специальный алгоритм + 3) Автоматическая работа программы

Вторая часть формулы – это специальный алгоритм, благодаря которому происходит процесс машинного обучения. Их существует несколько видов: нейронные сети, обучение с учителем, обучение без учителя, обучение с подкреплением и др.

📌 Алгоритм можно сравнить с пошаговым «рецептом», который детально объясняет, каким именно способом мы будем обучать программу на данных.

Вид и тип алгоритма выбирается разработчиками будущего ИИ на первом этапе планирования. Так как от типа алгоритма зависит принцип работы, масштаб и конечный результат.


Например, в обычной жизни мы знаем, что из курицы, картошки, помидор и сыра (имеющиеся данные) можно приготовить десятки разных блюд, используя разные рецепты/алгоритмы. Так и в процессе создания AI мы выбираем из десятков вариантов «обучения» один из «рецептов» (алгоритмов). Кстати, следуя разным рецептам, в результате будет не только разный внешний вид блюд, но и разный вкус.

📌 Алгоритм машинного обучения – это набор правил и инструкций, который пошагово объясняет, каким именно способом будет обучаться программа. Существуют разные типы алгоритмов: нейронные сети, обучение с учителем, обучение без учителя, обучение с подкреплением и др.

3 элемент – автоматизация

Иллюстрация создана нейросетью Midjourney в @GPT4Telegrambot /imagine человек лежит на шезлонге у бассейна с компьютером и пьет коктейль --style raw --ar 16:9

Машинное обучение = 1) Данные + 2) Специальный алгоритм + 3) Автоматическая работа программы

В процессе создания AI учитываются миллиарды единиц контента и параметров (условий), по которым финально идет обучение. Разработчики просто физически не могут постоянно подключаться и отлаживать все индивидуально. Это точно не ручная работа.

Поэтому в самом начале подбирается или создается алгоритм, который позволяет компьютерной программе обучаться самостоятельно, анализировать и делать верные выводы в различных ситуациях.


Например: если вы хотите научить программу различать кошек и собак, то вам не нужно каждый раз рассказывать ей все правила (эти гавкают, а эти мяукают), вы просто показываете ей много-много фотографий кошек и собак.

Сначала вы говорите, какое животное на каждой фотографии, а затем она начинает замечать различия самостоятельно. После просмотра достаточного количества фотографий кошек и собак, программа начинает правильно угадывать, кто есть кто на новых фотографиях.

Иллюстрация создана нейросетью Midjourney в @GPT4Telegrambot /imagine большое количество портретов кошек и собак --style raw --ar 16:9

Самостоятельное обучение программы без человека является важным и, возможно даже, основным преимуществом машинного обучения в процессе создания AI. Благодаря этой способности программы могут сами извлекать закономерности из данных, анализировать их и использовать для решения задач, которые ставит человек. И чем больше данных и чем больше программа «учится», тем точнее становятся ее ответы.

Кстати, термины «Машинное обучение» и «Алгоритмы машинного обучения» чаще всего используются создателями AI, а не потребителями, так как в большей степени носят научный и профессиональный характер.

Обычные пользователи AI-продуктов не делят AI на этапы и называют все технологии – искусственный интеллект или нейросети. И это нормально.

Но в этом модуле мы учимся понимать, как создается AI, поэтому проходим каждый уровень поэтапно и стараемся раскрыть его суть простыми словами.

4 ступень – Нейронные сети (нейросети)

Иллюстрация создана нейросетью Midjourney в @GPT4Telegrambot /imagine мозг похожий на нейросеть --ar 16:9

Наконец-то мы дошли до термина «Нейронная сеть» или «нейросеть» – это второе по популярности слово, которое люди часто используют, когда говорят про AI в общении, СМИ, соцсетях и пр. Все новые AI-достижения стали резко называться «нейросети» :)

Этот термин действительно красиво звучит и сразу же говорит о том, что принцип создания нейросетей визуально напоминает по структуре и функционированию мозг человека.

Посмотрите сами.

Слева: схема нейронной сети (слои, сигналы, узлы)   Справа: нейроны головного мозга человека при увеличении

Давайте вспомним, что в предыдущем блоке этого урока мы уже использовали вскользь слово «нейросеть», когда говорили о том, какие типы алгоритмов машинного обучения существуют. Теперь давайте раскроем его значение полностью.

📌 Нейросети – наиболее сложный вид алгоритмов машинного обучения для создания AI. Нейросети состоят из единиц, называемых «нейронами», которые связаны друг с другом и могут передавать сигналы. А также из множества слоев, узлов и включают в себя миллиарды параметров, которые нужно учитывать в процессе обучения.

Визуально компьютерные схемы нейросетей напоминают мозг человека. Существуют два основных типа: языковые модели нейросетей (создают тексты) и диффузионные модели (создают картинки, видео, музыку и пр.).

📌 Параметры нейросети – это как миллионы учебников и правил, по которым она учится. То, что ей нужно учесть и не забыть в процессе обучения.

Иллюстрация создана нейросетью Midjourney в @GPT4Telegrambot /imagine миллионы книг, учебников и правил для обучения --ar 16:9

Подробнее об этом будет рассказано в следующем уроке, где мы подробно рассмотрим работу текстовых нейросетей.


Так например у популярной модели нейросети GPT-4 1.76 триллиона параметров. А у российского GigaChat – только 29 миллиардов.

5 ступень – Типы нейросетей

Ура! Мы достигли последнего уровня пирамиды, где сейчас узнаем о том, какие нейросети бывают и в чем их отличия.

Нейронные сети можно разделить на 2 основных типа в зависимости от того, что они создают – тексты или картинки, видео, музыку и пр.

Тип 1 – Языковые модели нейросетей

Для создания новых текстов с помощью AI – используются языковые модели нейросетей (Language Models, LM). Они заточены на работу с естественным языком человека (тот, на котором он говорит).

Задача этих нейросетей понять язык человека и дать ему подходящий ответ в текстовом виде, как бы это сделал человек.

Например, самые известные языковые модели это: GPT-4 или Claude3.

В жизни это выглядит так:

Подробную схему работы языковых моделей мы рассмотрим на следующем уроке.

Тип 2 – Диффузионные

Для создания картинок, видео и музыки с помощью AI используют другой тип моделей нейросетей – диффузионные (Diffusion Model, DM).

Их задача – создать то изображение, видео или музыку, которые хочет получить человек, описав это на его родном языке (без программирования).

Например, самые известные диффузионные модели это: Midjourney, DALL-E3, Sora, Suno AI.

Работают диффузионные модели по принципу постепенного приближения или добавления шума – мы также рассмотрим это в следующем уроке.

📌 Кстати, иногда модель может быть мультимодальной, то есть можно работать и с текстом, и с видео, и с картинкам одновременно.

Считается, что именно за такими моделями будущее в AI.

Теперь мы знаем о двух основных типах нейронных сетей, о том, что нейросети – это самый сложный вид алгоритмов машинного обучения, а машинное обучение – это наиболее популярный способ создания AI. В свою очередь AI является частью большой научной области – компьютерных наук.

Давайте еще раз посмотрим на AI-пирамиду. Она может стать для вас небольшой шпаргалкой, напоминающей об основных понятиях в AI и как они связаны между собой.

До встречи на следующем уроке, где мы подробнее расскажем о том, какие нейросети работают с текстами, что такое LLM, промпт, память, контекст и как посчитать длину вопросов и ответов.

Словарь урока

📌 Компьютерные науки – это науки, которые изучают методы и процессы сбора, хранения, обработки, передачи, анализа и оценки информации с использованием компьютерных технологий (информация + компьютер).

📌 Искусственный интеллект – это компьютерные программы, цель которых имитировать интеллектуальные способности человека, обучаясь на большом количестве данных.

📌Машинное обучение – это создание специальных алгоритмов, которые позволяют компьютерным программам самостоятельно учиться на больших объемах данных без постоянного вмешательства человека.

📌 Датасет – отобранная подходящая информация.

📌 Алгоритм машинного обучения – это набор правил и инструкций, который пошагово объясняет, каким именно способом будет обучаться программа. Существуют разные типы алгоритмов: нейронные сети, обучение с учителем, обучение без учителя, обучение с подкреплением и др.

📌 Алгоритм – пошаговый «рецепт», который детально объясняет, каким именно способом мы будем обучать программу на данных.

📌 Нейросети – наиболее сложный вид алгоритмов машинного обучения для создания AI.

📌 Параметры нейросети – это как миллионы учебников и правил, по которым она учится. То, что ей нужно учесть и не забыть в процессе обучения.

Задание

Пожалуйста, не забудьте выполнить легкое проверочное задание на закрепление полученного материала, а также поставить оценку этому уроку. Все это можно сделать в образовательном боте «Нейрограмотность» @EDU4Telegrambot.