Урок 4 «GPT, ChatGPT, GPT-4: в чем отличия?»

👩‍🏫 Автор урока: Анна Веклич, эксперт в сфере развития и продвижения высшего образования и науки, сооснователь @GPT4Telegrambot и автор курса «Нейрограмотность».

📌 В этом уроке вы узнаете, что такое GPT и почему эти «три буквы» может использовать любой, что такое ChatGPT, что лучше GPT-3.5 или GPT-4, когда ждать GPT-5.

Содержание конспекта

Что значит GPT?

📌 GPT (Generative Pre-trained Transformer ) – расшифровывается как «Трансформер, обученный на генерацию (создание) текста». Простыми словами это самый современный тип архитектуры, который позволяет создавать новые нейросети по принципу трансформера.

Он был создан учеными из Google в 2017 году. И именно благодаря этому трансформеру вся сфера генеративного AI получила новую жизнь, перейдя от застоя «зимы» к быстрому развитию. Создание архитектуры GPT сравнимо с открытием нефти, только для AI-мира. И теперь эту «нефть» каждый использует по-своему, создавая десятки тысяч новых нейросетей и сервисов на их основе.

Иллюстрация создана нейросетью Midjourney в @GPT4Telegrambot /imagine нефтяная скважина, из которой нефть бьет ключом --style raw --ar 16:9

С момента создания архитектуры GPT компания OpenAI начала активное развитие своих LLM (текстовых моделей), взяв за основу именно этот современный трансформер и аббревиатуру GPT в названия – модели GPT-1, GPT-2, GPT-3, GPT-4.

Первая LLM в далеком (!) 2018 году была названа GPT-1. Все последующие назывались по тому же принципу.

Также в ноябре 2022 года OpenAI открыла прямой доступ к искусственному интеллекту в виде специального чат-бота, назвав его ChatGPT. И тут мы тоже видим эти три буквы.

Сложилось впечатление, что GPT означает конкретную нейросеть от OpenAI. При этом, название GPT не принадлежит ей. Им могут пользоваться и другие разработчики нейросетей. Например, в России существует нейросеть YandexGPT, которая никак не связана с компанией OpenAI.

📌 Итак, GPT – это один из самых популярных типов архитектур для создания нейросетей, который может применять любой разработчик.

Модели GPT

С 2018 года компания OpenAI выпустила несколько моделей LLM (текстовых нейросетей), каждый раз улучшая предыдущую. Мы уже говорили, что выход новой модели нейросети – это как выход нового iPhone – об этом говорят все.

Наше знакомство с ними началось с модели GPT-3 в ноябре 2022 года. Той самой, которая не знала, кто убил Пушкина и не могла сосчитать 2+2. И все равно она была очень умной и вызывала WOW-эффект от общения!

Именно на базе этой модели («под капотом») был запущен ChatGPT. После вышла GPT-3.5 в разных вариациях и, наконец, летом 2023 года появилась знаменитая и самая точная модель GPT-4.

Многим людям для решения бытовых и рабочих вопросов подходит бесплатная версия GPT-3.5, кому-то больше нравится точная и современная GPT-4.

📌 Вы сами можете выбирать между ними и переключаться, когда необходимо. Внешне вы не увидите изменений, но зато можете их почувствовать в ответах от нейросети.

Давайте сравним ответы на один и тот же вопрос от GPT-3.5 и GPT-4.

Ответ от GPT-3.5 в @GPT4Telegrambot (не верно)

Ответ от GPT-4 в @GPT4Telegrambot (верно)

Во многих ситуациях GPT-3.5 отвечает верно и ее уровня знаний достаточно для работы, но есть моменты, когда она не знает ответ и начинает придумывать «на ходу», что не соответствует фактам и может ввести человека в заблуждение.

Так и хочется сказать, что лучше бы она призналась, что не знает, чем так. Конечно же, все мы помним, что рассказ Ивана Тургенева «Муму» вовсе не про крепостную женщину. И здесь модель GPT-3.5 ошиблась.

📌 Поэтому важно понимать особенности разных моделей нейросетей, знать, когда их нужно перепроверять и то, что не стоит им доверять на 100%. Пока они все еще могут допускать ошибки. Но это только пока.

Выбрать модель GPT-3.5 или GPT-4 можно в разделе «Настройки» @GPT4Telegrambot.

📌 При этом у вас есть 50 бесплатных запросов к GPT-3.5 в неделю, чтобы протестировать, как она работает и подходит ли вам для решения задач.

Что умеет GPT-4?

Если коротко – многое! Давайте поймем, что именно!

1. Создание любых текстов:

поздравления
письма
тексты для презентаций
креативные идеи и бизнес-планы
анализ информации и краткое содержание любого произведения/новости
посты для соцетей
переводы и пр.

2. Понимать ваш голос и отвечать голосом:

Вы можете задать вопрос голосом, а также получить голосовой ответ. Это удобно, если нет времени написать сообщение. Или если вы хотите послушать речь от нейросети.

Например, эту функцию можно использовать в другой стране, когда вы не знаете, как спросить что-то.

На одном из рынков в Анталии никто не говоил по английски.

Имея GPT-4 в Telegram-боте мы попросили нейросеть сказать на турецком фразу:

«Где здесь продаются гранаты и клубника? Можно ли заплатить долларами?»

Нейросеть мгновенно это озвучила на турецком языке и продавец понял, что мы ищем.

Функция управления голосом доступна в разделе «Настройки» – «Голосовые ответы». Также там можно выбрать один из 6 голосов, который будет вам отвечать.

3. Распознавать изображения

📌 Одна из самых удобных и полезных функций – это распознавание изображения и ответы на вопросы, которые касаются его содержания.

Вы можете сфотографировать цветок на улице и спросить GPT-4, что это? Буквально через через пару секунд он вам подробно ответит.

Примеры:

Также вы можете распознавать тексты на иностранном языке и просить их перевести на русский, любые схемы, объекты и многое другое. Просто сфотографируйте это (или скачайте на телефон/компьютер) и загрузите в бот, где подключена функция GPT-4.

📌 Важно: не рекомендуется так делать с вашими медицинскими анализами или реальными фотографиями людей. Бот часто отказывается их распознавать.

4. Решать задачи

Еще одна опция GPT-4 – способность решать математические, физические и другие задачи. Вы можете решить математический пример, загрузить фото решения и попросить нейросеть проверить.

Главное помнить, что она тоже может ошибаться. Либо вы можете загрузить уравнение и попросить объяснить, каким образом его лучше решить. Давайте посмотрим на два варианта.

Пример:

Решение задач через GPT-4 в @GPT4Telegrambot (не доверяйте нейросетям на 100%, проверяйте сами решение)

5. Писать код

GPT-4 может писать код для разных задач.

Пример:

6. Работать с документами

GPT-4 умеет распознавать документы и отвечать на вопросы по ним.

Например, вы можете загрузить таблицу с данными и попросить сделать вывод. Или загрузить новостную статью и попросить сделать ее резюме.

Также можно быстро искать данные в большом файле и просить их трансформировать в другой вид.

📌 В боте @GPT4Telegrambot такая функция также доступна, но на базе другой модели – Claude 3, так как она дает возможность работать с бОльшим объемом информации.

📌 Память Claude 3 – 200К токенов, против 128К в GPT-4.

Вы просто загружаете документ и начинаете задавать вопросы по его содержанию.

Пример:

Летом 2024 года разработчики обещают показать GPT-5, но пока это только слухи. Чем она будет отличаться от GPT-4 пока тоже неизвестно. Но уже понятно, что это будет еще один прорыв в области AI. Поэтому ждем! А пока учимся на полную мощь использовать GPT-4.

Таблица: Сравнение моделей GPT-3.5 и GPT-4 (для @GPT4Telegrambot)

ChatGPT и другие сервисы на базе LLM

📌 ChatGPT – это внешняя оболочка, удобный чат-бот, в который человек пишет вопрос и получает ответ. При этом вы сами можете выбрать, на базе какой модели он будет строить свой ответ. Внешних изменений вы не увидите. На данный момент доступны GPT-3.5 и GPT-4.

Многие AI-сервисы, как и ChatGPT, дают возможность пользователю самому выбирать тип LLM.

Самый яркий пример такого сервиса – это новый поисковик Perplexity, в котором вы можете выбирать, какая именно LLM будет отвечать на ваши вопросы из десятков разных вариантов.

Поэтому правильно говорить, что Perplexity – это не нейросеть, а сервис или компания, основанная на разных LLM «под капотом».

Второй пример – это @GPT4Telegrambot, который в виде Telegram-бота предоставляет прямой доступ к самым популярным нейросетям: GPT-3.5 и GPT-4, Claude 3, Midjourney, Suno AI и др.

Резюме

Давайте еще раз закрепим информацию:

GPT – тип архитектуры нейросетей. Может использоваться разными компаниями и разработчиками. Это аббревиатура, которая никому не принадлежит.
GPT-1, GPT-2, GPT-3, GPT-3.5, GPT-4 – это названия LLM от компании OpenAI. Чем больше цифра, тем современнее модель.
ChatGPT – специальный понятно и красиво оформленный чат от компании OpenAI для прямого общения человека с LLM в виде сайта, приложения или в виде бота.

📌 «Под капотом» у ChatGPT может находиться как GPT 3.5, так и GPT-4. Решение остается за вами. Если у вас есть возможность, то всегда выбирайте GPT-4, как самую качественную и «умную» модель на сегодняшний день.

AI-сервисы на базе разных LLM – внешний интерфейс чат-бота, сайта, приложения или Telegram-бота, например: Perplexity или @GPT4Telegrambot

Теперь в разговоре с друзьями или коллегами вы можете рассказать, что GPT – это вовсе не название нейросети, что модель GPT-4 может не только создавать тексты, но и решать математические задачи или описывать растения по фото, что новый мир нейросетей развивается очень быстро и что каждый современный человек должен быть нейрограмотным.

Приглашайте знакомых и близких пройти этот открытый бесплатный образовательный курс в Telegram. И до встречи на следующем уроке.

Словарь урока

GPT-1, GPT-2, GPT-3, GPT-3.5, GPT-4 – это названия LLM от компании OpenAI. Чем больше цифра, тем современнее модель.

ChatGPT – специальный понятно и красиво оформленный чат от компании OpenAI для прямого общения человека с LLM в виде сайта, приложения или в виде бота.

Задание

Пожалуйста, не забудьте выполнить легкое проверочное задание на закрепление полученного материала, а также поставить оценку этому уроку. Все это можно сделать в образовательном боте «Нейрограмотность» @EDU4Telegrambot.