Урок 2 «Основные понятия в AI»
👩🏫 Автор урока: Анна Веклич, эксперт в сфере развития и продвижения высшего образования и науки, сооснователь @GPT4Telegrambot и автор курса «Нейрограмотность».
📌 В этом уроке вы узнаете основные термины, поймете, как они связаны между собой, почему самые умные нейросети в мире не знают, какое сегодня число, а также какие бывают нейросети.
Содержание конспекта
AI-пирамида или что есть что в мире AI?
Урок пройдет в формате от общего к частному. Для наглядной демонстрации, мы подготовили схему, которую разберем по частям сверху-вниз. И начнем мы с самого фундамента – компьютерных наук. Именно благодаря развитию этой сферы сегодня люди могут создавать искусственный интеллект. Давайте же поймем как?
1 ступень – Компьютерные науки
📌 Компьютерные науки – это науки, которые изучают методы и процессы сбора, хранения, обработки, передачи, анализа и оценки информации с использованием компьютерных технологий (информация + компьютер).
Появились они более 80 лет назад в период создания первого компьютера известным немецким инженером Конрадом Цузе в 1938 году.
Широкое распространение получили в 1950-х – 1960-х годах, а начиная с 2000-х именно эта сфера стала ТОП-1 по скорости развития и популярности (да-да, все захотели работать в ИТ и быть высокооплачиваемыми программистами).
Компьютерные науки изучают такие сферы, как:
2 ступень – Искусственный интеллект (AI)
Итак, AI – это один из разделов компьютерных наук. И, возможно, самый популярный на сегодняшний день. В предыдущем уроке мы уже дали определение этому термину. Давайте его еще раз зафиксируем.
📌 Искусственный интеллект – это компьютерные программы, цель которых имитировать интеллектуальные способности человека, обучаясь на большом количестве данных.
- общаться с людьми на их родном языке (естественном языке)
- создавать уникальное (дизайн, видео, текстовая информация и др.)
- принимать решения (какой шаг сделать в шахматах, покере, шашках и др.)
- управлять процессом или объектом (автопилоты)
- предсказывать (продажи, погоду, заболевания)
- обучаться новому (владеть актуальной информацией, совершенствовать свои знания) и др.
Для пользователей искусственный интеллект может выглядеть в виде системы управления автомобилем, сайта, онлайн-переводчика, мобильного приложения, голосового помощника или чат-бота в Telegram.
Также мы с вами знаем, что существует два основных типа AI – генеративный (для создания текстов, картинок, видео, музыки) и не генеративный (который работает с распознаванием, предсказанием, рекомендациями, диагностикой и др.).
AI создают программисты, инженеры, дата-сайентисты и другие. Все, что мы сейчас с вами слышим про AI и чем будем учиться пользоваться на курсе «Нейрограмотность» – относится к понятию генеративный AI.
Например: ChatGPT, Claude 3, Midjourney, DALL-E 3, Suno AI, Sora и др.
3 ступень – Машинное обучение (ML)
AI можно создавать десятками разных способов. Один из самых популярных подходов – это «Машинное обучение», МО (Machine Learning, ML). Именно благодаря МО программы становятся «умными».
Чтобы компьютерная программа могла имитировать интеллект человека, общаться и вести себя как мы, необходимо ее этому научить. То есть дать много данных о нашем мире и написать специальный алгоритм, который позволит программе учиться самой, без постоянного привлечения человека.
📌 Машинное обучение – это создание специальных алгоритмов, которые позволяют компьютерным программам самостоятельно учиться на больших объемах данных без постоянного вмешательства человека.
Формула машинного обучения может выглядеть так:
Машинное обучение = 1) Данные + 2) Специальный алгоритм + 3) Автоматическая работа программы
Давайте разберем ее подробнее.
1 элемент – данные / Big Data
В процессе машинного обучения в компьютерную программу загружается очень много информации (Big Data).
📌 Это миллиарды, триллионы единиц контента (новости, картинки, интернет-страницы из всех открытых источников, документы, книги, звуки)
И от того, какая цель у AI, зависит, что именно нужно загружать.
От качества этих данных зависит качество ответов от AI-программы. Поэтому так важно сразу определить источники информации, на которых будет учиться программа. При этом, чтобы не нарушить права авторов (художников, писателей, певцов).
Например, если вы всегда читаете только желтую прессу, то ваш словарный запас будет состоять из определенных слов и оборотов этого стиля (потому что вы «загружали» такие тексты и стиль в свой мозг). То же происходит и с нейросетями, только в бОльшем масштабе. Качество ответов нейросетей зависит от качества и количества данных, на которых они учились.
Также у данных есть определенный срок годности и актуальности. Разработчики загружают информацию с определенной периодичностью. Например, раз в три месяца или раз в полгода.
Поэтому часть информации (новые факты, новости и события) во многих известных моделях нейросетей типа ChatGPT или Claude 3 просто отсутствует. А новые данные в них еще не успели загрузить.
Например, если модель GPT-4 обучена на данных о мире до декабря 2023 года, то, без выхода в Интернет, на вопрос «какое сегодня число» (27 апреля 2024) или «расскажи новости за прошедшую неделю», она не может ответить корректно. Теперь понимаете почему?
По этой же причине нейросети типа ChatGPT и Claude 3 не могут точно ответить на вопрос о том, кто вы, если вы пишете свое имя и фамилию (если вы, конечно, не Леонардо Дикаприо). О вас просто недостаточно информации в тех источниках, на которых училась нейросеть. Это отличает нейросети от традиционных поисковиков, типа Google. Об этом мы писали в предыдущем уроке.
2 элемент – специальный алгоритм / «рецепт»
Машинное обучение = 1) Данные + 2) Специальный алгоритм + 3) Автоматическая работа программы
Вторая часть формулы – это специальный алгоритм, благодаря которому происходит процесс машинного обучения. Их существует несколько видов: нейронные сети, обучение с учителем, обучение без учителя, обучение с подкреплением и др.
📌 Алгоритм можно сравнить с пошаговым «рецептом», который детально объясняет, каким именно способом мы будем обучать программу на данных.
Вид и тип алгоритма выбирается разработчиками будущего ИИ на первом этапе планирования. Так как от типа алгоритма зависит принцип работы, масштаб и конечный результат.
Например, в обычной жизни мы знаем, что из курицы, картошки, помидор и сыра (имеющиеся данные) можно приготовить десятки разных блюд, используя разные рецепты/алгоритмы. Так и в процессе создания AI мы выбираем из десятков вариантов «обучения» один из «рецептов» (алгоритмов). Кстати, следуя разным рецептам, в результате будет не только разный внешний вид блюд, но и разный вкус.
📌 Алгоритм машинного обучения – это набор правил и инструкций, который пошагово объясняет, каким именно способом будет обучаться программа. Существуют разные типы алгоритмов: нейронные сети, обучение с учителем, обучение без учителя, обучение с подкреплением и др.
3 элемент – автоматизация
Машинное обучение = 1) Данные + 2) Специальный алгоритм + 3) Автоматическая работа программы
В процессе создания AI учитываются миллиарды единиц контента и параметров (условий), по которым финально идет обучение. Разработчики просто физически не могут постоянно подключаться и отлаживать все индивидуально. Это точно не ручная работа.
Поэтому в самом начале подбирается или создается алгоритм, который позволяет компьютерной программе обучаться самостоятельно, анализировать и делать верные выводы в различных ситуациях.
Например: если вы хотите научить программу различать кошек и собак, то вам не нужно каждый раз рассказывать ей все правила (эти гавкают, а эти мяукают), вы просто показываете ей много-много фотографий кошек и собак.
Сначала вы говорите, какое животное на каждой фотографии, а затем она начинает замечать различия самостоятельно. После просмотра достаточного количества фотографий кошек и собак, программа начинает правильно угадывать, кто есть кто на новых фотографиях.
Самостоятельное обучение программы без человека является важным и, возможно даже, основным преимуществом машинного обучения в процессе создания AI. Благодаря этой способности программы могут сами извлекать закономерности из данных, анализировать их и использовать для решения задач, которые ставит человек. И чем больше данных и чем больше программа «учится», тем точнее становятся ее ответы.
Кстати, термины «Машинное обучение» и «Алгоритмы машинного обучения» чаще всего используются создателями AI, а не потребителями, так как в большей степени носят научный и профессиональный характер.
Обычные пользователи AI-продуктов не делят AI на этапы и называют все технологии – искусственный интеллект или нейросети. И это нормально.
Но в этом модуле мы учимся понимать, как создается AI, поэтому проходим каждый уровень поэтапно и стараемся раскрыть его суть простыми словами.
4 ступень – Нейронные сети (нейросети)
Наконец-то мы дошли до термина «Нейронная сеть» или «нейросеть» – это второе по популярности слово, которое люди часто используют, когда говорят про AI в общении, СМИ, соцсетях и пр. Все новые AI-достижения стали резко называться «нейросети» :)
Этот термин действительно красиво звучит и сразу же говорит о том, что принцип создания нейросетей визуально напоминает по структуре и функционированию мозг человека.
Давайте вспомним, что в предыдущем блоке этого урока мы уже использовали вскользь слово «нейросеть», когда говорили о том, какие типы алгоритмов машинного обучения существуют. Теперь давайте раскроем его значение полностью.
📌 Нейросети – наиболее сложный вид алгоритмов машинного обучения для создания AI. Нейросети состоят из единиц, называемых «нейронами», которые связаны друг с другом и могут передавать сигналы. А также из множества слоев, узлов и включают в себя миллиарды параметров, которые нужно учитывать в процессе обучения.
Визуально компьютерные схемы нейросетей напоминают мозг человека. Существуют два основных типа: языковые модели нейросетей (создают тексты) и диффузионные модели (создают картинки, видео, музыку и пр.).
📌 Параметры нейросети – это как миллионы учебников и правил, по которым она учится. То, что ей нужно учесть и не забыть в процессе обучения.
Подробнее об этом будет рассказано в следующем уроке, где мы подробно рассмотрим работу текстовых нейросетей.
Так например у популярной модели нейросети GPT-4 1.76 триллиона параметров. А у российского GigaChat – только 29 миллиардов.
5 ступень – Типы нейросетей
Ура! Мы достигли последнего уровня пирамиды, где сейчас узнаем о том, какие нейросети бывают и в чем их отличия.
Нейронные сети можно разделить на 2 основных типа в зависимости от того, что они создают – тексты или картинки, видео, музыку и пр.
Тип 1 – Языковые модели нейросетей
Для создания новых текстов с помощью AI – используются языковые модели нейросетей (Language Models, LM). Они заточены на работу с естественным языком человека (тот, на котором он говорит).
Задача этих нейросетей понять язык человека и дать ему подходящий ответ в текстовом виде, как бы это сделал человек.
Например, самые известные языковые модели это: GPT-4 или Claude3.
Подробную схему работы языковых моделей мы рассмотрим на следующем уроке.
Для создания картинок, видео и музыки с помощью AI используют другой тип моделей нейросетей – диффузионные (Diffusion Model, DM).
Их задача – создать то изображение, видео или музыку, которые хочет получить человек, описав это на его родном языке (без программирования).
Например, самые известные диффузионные модели это: Midjourney, DALL-E3, Sora, Suno AI.
Работают диффузионные модели по принципу постепенного приближения или добавления шума – мы также рассмотрим это в следующем уроке.
📌 Кстати, иногда модель может быть мультимодальной, то есть можно работать и с текстом, и с видео, и с картинкам одновременно.
Считается, что именно за такими моделями будущее в AI.
Теперь мы знаем о двух основных типах нейронных сетей, о том, что нейросети – это самый сложный вид алгоритмов машинного обучения, а машинное обучение – это наиболее популярный способ создания AI. В свою очередь AI является частью большой научной области – компьютерных наук.
Давайте еще раз посмотрим на AI-пирамиду. Она может стать для вас небольшой шпаргалкой, напоминающей об основных понятиях в AI и как они связаны между собой.
До встречи на следующем уроке, где мы подробнее расскажем о том, какие нейросети работают с текстами, что такое LLM, промпт, память, контекст и как посчитать длину вопросов и ответов.
Словарь урока
📌 Компьютерные науки – это науки, которые изучают методы и процессы сбора, хранения, обработки, передачи, анализа и оценки информации с использованием компьютерных технологий (информация + компьютер).
📌 Искусственный интеллект – это компьютерные программы, цель которых имитировать интеллектуальные способности человека, обучаясь на большом количестве данных.
📌Машинное обучение – это создание специальных алгоритмов, которые позволяют компьютерным программам самостоятельно учиться на больших объемах данных без постоянного вмешательства человека.
📌 Датасет – отобранная подходящая информация.
📌 Алгоритм машинного обучения – это набор правил и инструкций, который пошагово объясняет, каким именно способом будет обучаться программа. Существуют разные типы алгоритмов: нейронные сети, обучение с учителем, обучение без учителя, обучение с подкреплением и др.
📌 Алгоритм – пошаговый «рецепт», который детально объясняет, каким именно способом мы будем обучать программу на данных.
📌 Нейросети – наиболее сложный вид алгоритмов машинного обучения для создания AI.
📌 Параметры нейросети – это как миллионы учебников и правил, по которым она учится. То, что ей нужно учесть и не забыть в процессе обучения.
Задание
Пожалуйста, не забудьте выполнить легкое проверочное задание на закрепление полученного материала, а также поставить оценку этому уроку. Все это можно сделать в образовательном боте «Нейрограмотность» @EDU4Telegrambot.