Урок 4 «GPT, ChatGPT, GPT-4: в чем отличия?»
👩🏫 Автор урока: Анна Веклич, эксперт в сфере развития и продвижения высшего образования и науки, сооснователь @GPT4Telegrambot и автор курса «Нейрограмотность».
📌 В этом уроке вы узнаете, что такое GPT и почему эти «три буквы» может использовать любой, что такое ChatGPT, что лучше GPT-3.5 или GPT-4, когда ждать GPT-5.
Содержание конспекта
Что значит GPT?
📌 GPT (Generative Pre-trained Transformer ) – расшифровывается как «Трансформер, обученный на генерацию (создание) текста». Простыми словами это самый современный тип архитектуры, который позволяет создавать новые нейросети по принципу трансформера.
Он был создан учеными из Google в 2017 году. И именно благодаря этому трансформеру вся сфера генеративного AI получила новую жизнь, перейдя от застоя «зимы» к быстрому развитию. Создание архитектуры GPT сравнимо с открытием нефти, только для AI-мира. И теперь эту «нефть» каждый использует по-своему, создавая десятки тысяч новых нейросетей и сервисов на их основе.
С момента создания архитектуры GPT компания OpenAI начала активное развитие своих LLM (текстовых моделей), взяв за основу именно этот современный трансформер и аббревиатуру GPT в названия – модели GPT-1, GPT-2, GPT-3, GPT-4.
Первая LLM в далеком (!) 2018 году была названа GPT-1. Все последующие назывались по тому же принципу.
Также в ноябре 2022 года OpenAI открыла прямой доступ к искусственному интеллекту в виде специального чат-бота, назвав его ChatGPT. И тут мы тоже видим эти три буквы.
Сложилось впечатление, что GPT означает конкретную нейросеть от OpenAI. При этом, название GPT не принадлежит ей. Им могут пользоваться и другие разработчики нейросетей. Например, в России существует нейросеть YandexGPT, которая никак не связана с компанией OpenAI.
📌 Итак, GPT – это один из самых популярных типов архитектур для создания нейросетей, который может применять любой разработчик.
Модели GPT
С 2018 года компания OpenAI выпустила несколько моделей LLM (текстовых нейросетей), каждый раз улучшая предыдущую. Мы уже говорили, что выход новой модели нейросети – это как выход нового iPhone – об этом говорят все.
Наше знакомство с ними началось с модели GPT-3 в ноябре 2022 года. Той самой, которая не знала, кто убил Пушкина и не могла сосчитать 2+2. И все равно она была очень умной и вызывала WOW-эффект от общения!
Именно на базе этой модели («под капотом») был запущен ChatGPT. После вышла GPT-3.5 в разных вариациях и, наконец, летом 2023 года появилась знаменитая и самая точная модель GPT-4.
Многим людям для решения бытовых и рабочих вопросов подходит бесплатная версия GPT-3.5, кому-то больше нравится точная и современная GPT-4.
📌 Вы сами можете выбирать между ними и переключаться, когда необходимо. Внешне вы не увидите изменений, но зато можете их почувствовать в ответах от нейросети.
Давайте сравним ответы на один и тот же вопрос от GPT-3.5 и GPT-4.
Во многих ситуациях GPT-3.5 отвечает верно и ее уровня знаний достаточно для работы, но есть моменты, когда она не знает ответ и начинает придумывать «на ходу», что не соответствует фактам и может ввести человека в заблуждение.
Так и хочется сказать, что лучше бы она призналась, что не знает, чем так. Конечно же, все мы помним, что рассказ Ивана Тургенева «Муму» вовсе не про крепостную женщину. И здесь модель GPT-3.5 ошиблась.
📌 Поэтому важно понимать особенности разных моделей нейросетей, знать, когда их нужно перепроверять и то, что не стоит им доверять на 100%. Пока они все еще могут допускать ошибки. Но это только пока.
Выбрать модель GPT-3.5 или GPT-4 можно в разделе «Настройки» @GPT4Telegrambot.
📌 При этом у вас есть 50 бесплатных запросов к GPT-3.5 в неделю, чтобы протестировать, как она работает и подходит ли вам для решения задач.
Что умеет GPT-4?
Если коротко – многое! Давайте поймем, что именно!
- поздравления
- письма
- тексты для презентаций
- креативные идеи и бизнес-планы
- анализ информации и краткое содержание любого произведения/новости
- посты для соцетей
- переводы и пр.
2. Понимать ваш голос и отвечать голосом:
Вы можете задать вопрос голосом, а также получить голосовой ответ. Это удобно, если нет времени написать сообщение. Или если вы хотите послушать речь от нейросети.
Например, эту функцию можно использовать в другой стране, когда вы не знаете, как спросить что-то.
На одном из рынков в Анталии никто не говоил по английски.
Имея GPT-4 в Telegram-боте мы попросили нейросеть сказать на турецком фразу:
«Где здесь продаются гранаты и клубника? Можно ли заплатить долларами?»
Нейросеть мгновенно это озвучила на турецком языке и продавец понял, что мы ищем.
Функция управления голосом доступна в разделе «Настройки» – «Голосовые ответы». Также там можно выбрать один из 6 голосов, который будет вам отвечать.
📌 Одна из самых удобных и полезных функций – это распознавание изображения и ответы на вопросы, которые касаются его содержания.
Вы можете сфотографировать цветок на улице и спросить GPT-4, что это? Буквально через через пару секунд он вам подробно ответит.
Также вы можете распознавать тексты на иностранном языке и просить их перевести на русский, любые схемы, объекты и многое другое. Просто сфотографируйте это (или скачайте на телефон/компьютер) и загрузите в бот, где подключена функция GPT-4.
📌 Важно: не рекомендуется так делать с вашими медицинскими анализами или реальными фотографиями людей. Бот часто отказывается их распознавать.
Еще одна опция GPT-4 – способность решать математические, физические и другие задачи. Вы можете решить математический пример, загрузить фото решения и попросить нейросеть проверить.
Главное помнить, что она тоже может ошибаться. Либо вы можете загрузить уравнение и попросить объяснить, каким образом его лучше решить. Давайте посмотрим на два варианта.
GPT-4 может писать код для разных задач.
GPT-4 умеет распознавать документы и отвечать на вопросы по ним.
Например, вы можете загрузить таблицу с данными и попросить сделать вывод. Или загрузить новостную статью и попросить сделать ее резюме.
Также можно быстро искать данные в большом файле и просить их трансформировать в другой вид.
📌 В боте @GPT4Telegrambot такая функция также доступна, но на базе другой модели – Claude 3, так как она дает возможность работать с бОльшим объемом информации.
Вы просто загружаете документ и начинаете задавать вопросы по его содержанию.
Летом 2024 года разработчики обещают показать GPT-5, но пока это только слухи. Чем она будет отличаться от GPT-4 пока тоже неизвестно. Но уже понятно, что это будет еще один прорыв в области AI. Поэтому ждем! А пока учимся на полную мощь использовать GPT-4.
Таблица: Сравнение моделей GPT-3.5 и GPT-4 (для @GPT4Telegrambot)
ChatGPT и другие сервисы на базе LLM
📌 ChatGPT – это внешняя оболочка, удобный чат-бот, в который человек пишет вопрос и получает ответ. При этом вы сами можете выбрать, на базе какой модели он будет строить свой ответ. Внешних изменений вы не увидите. На данный момент доступны GPT-3.5 и GPT-4.
Многие AI-сервисы, как и ChatGPT, дают возможность пользователю самому выбирать тип LLM.
Самый яркий пример такого сервиса – это новый поисковик Perplexity, в котором вы можете выбирать, какая именно LLM будет отвечать на ваши вопросы из десятков разных вариантов.
Поэтому правильно говорить, что Perplexity – это не нейросеть, а сервис или компания, основанная на разных LLM «под капотом».
Второй пример – это @GPT4Telegrambot, который в виде Telegram-бота предоставляет прямой доступ к самым популярным нейросетям: GPT-3.5 и GPT-4, Claude 3, Midjourney, Suno AI и др.
Резюме
Давайте еще раз закрепим информацию:
- GPT – тип архитектуры нейросетей. Может использоваться разными компаниями и разработчиками. Это аббревиатура, которая никому не принадлежит.
- GPT-1, GPT-2, GPT-3, GPT-3.5, GPT-4 – это названия LLM от компании OpenAI. Чем больше цифра, тем современнее модель.
- ChatGPT – специальный понятно и красиво оформленный чат от компании OpenAI для прямого общения человека с LLM в виде сайта, приложения или в виде бота.
📌 «Под капотом» у ChatGPT может находиться как GPT 3.5, так и GPT-4. Решение остается за вами. Если у вас есть возможность, то всегда выбирайте GPT-4, как самую качественную и «умную» модель на сегодняшний день.
- AI-сервисы на базе разных LLM – внешний интерфейс чат-бота, сайта, приложения или Telegram-бота, например: Perplexity или @GPT4Telegrambot
Теперь в разговоре с друзьями или коллегами вы можете рассказать, что GPT – это вовсе не название нейросети, что модель GPT-4 может не только создавать тексты, но и решать математические задачи или описывать растения по фото, что новый мир нейросетей развивается очень быстро и что каждый современный человек должен быть нейрограмотным.
Приглашайте знакомых и близких пройти этот открытый бесплатный образовательный курс в Telegram. И до встречи на следующем уроке.
Словарь урока
📌 GPT (Generative Pre-trained Transformer ) – расшифровывается как «Трансформер, обученный на генерацию (создание) текста». Простыми словами это самый современный тип архитектуры, который позволяет создавать новые нейросети по принципу трансформера.
GPT-1, GPT-2, GPT-3, GPT-3.5, GPT-4 – это названия LLM от компании OpenAI. Чем больше цифра, тем современнее модель.
ChatGPT – специальный понятно и красиво оформленный чат от компании OpenAI для прямого общения человека с LLM в виде сайта, приложения или в виде бота.
Задание
Пожалуйста, не забудьте выполнить легкое проверочное задание на закрепление полученного материала, а также поставить оценку этому уроку. Все это можно сделать в образовательном боте «Нейрограмотность» @EDU4Telegrambot.