Теория | Про AI простыми словами
June 24

Урок 12 «AI-словарь» 

📌AI, или Artificial Intelligence (произносится как «эй ай») – это специальные компьютерные программы, главная цель которых имитировать интеллектуальные способности человека, обучаясь на большом количестве данных.

📌 Алгоритм машинного обучения – это набор правил и инструкций, который пошагово объясняет, каким именно способом будет обучаться программа. Существуют разные типы алгоритмов: нейронные сети, обучение с учителем, обучение без учителя, обучение с подкреплением и др.

📌 AI-зима – периоды времени, когда интерес, инвестиции и ожидания в области искусственного интеллекта резко падают после предыдущих волн энтузиазма и оптимизма. Сокращается финансирование исследований, уменьшается количество публикаций и разработок, а также появляется пессимизм в отношении будущего ИИ.

📌 ANI, или Искусственный интеллект узкого назначения (Narrow AI) – тип AI, нацеленный на решение только узконаправленной задачи. Такой тип AI может отлично справляться с четко поставленной задачей на уровне человека или превосходя его, но он ограничен определённым набором функций и не способен выходить за рамки заранее заданных правил или обучения и широко мыслить, как человек. Примеры: ChatGPT, Midjourney, Claude и др.

📌 AGI, или Искусственный общий интеллект (Artificial General Intelligence), представляет собой гипотетическую (несуществующую) технологию искусственного интеллекта, способную к обучению, пониманию, рассуждению и принятию решений на уровне человеческого разума.

📌 Большие языковые модели (LLM) – тип нейросети, специализированный на обработке и понимании естественного языка. Используется для генерации текстов по принципу предсказания следующего слова (предложения или даже целого абзаца) на основании данных, на которых она была обучена. Примеры: GPT-3.5, GPT-4, Claude 3, Gemini и др.

📌 Big Data («большие данные») – миллиарды единиц информации о мире (новости, картинки, информация из интернета и всех открытых источников, документы, книги, звуки и пр.), которые используются для обучения AI, чтобы он стал «умным» и начал давать ответы, похожие на человека.

📌 Генеративный AI – это компьютерные программы, нацеленные на создание нового и уникального, как это делает человек: тексты, картинки, видео, звуки, музыка и др. Примеры: GPT-3.5, GPT-4, Claude 3, Gemini, Midjourney, DALL-E 3, Suno AI и др.

📌 Не генеративный AI – второй тип AI, который занимается анализом, прогнозированием, рекомендациями, распознаванием и многим другим. Примеры: беспилотные автомобили, система распознавания лиц, рекомендации в соцсетях и на сайтах и др.

📌 Датасет – отобранная подходящая информация (отобранные данные).

📌 Естественный язык – язык человека, на котором он общается (русский, английский, французский и любые другие языки, на которых мы можем говорить).

📌 GPT (Generative Pre-trained Transformer ) – расшифровывается как «Трансформер, обученный на генерацию (создание) текста». Простыми словами это самый современный тип архитектуры, который позволяет создавать новые нейросети по принципу трансформера.

📌 GPT-1, GPT-2, GPT-3, GPT-3.5, GPT-4 – это названия LLM от компании OpenAI. Чем больше цифра, тем современнее модель.

📌 Искусственный интеллект – это компьютерные программы, цель которых имитировать интеллектуальные способности человека, обучаясь на большом количестве данных.

📌 Компьютерные науки – это науки, которые изучают методы и процессы сбора, хранения, обработки, передачи, анализа и оценки информации с использованием компьютерных технологий (информация + компьютер).

📌 Контекстное окно – общий объем всех знаков, которые можно передать в нейросеть, чтобы спросить о чем-то.

📌Машинное обучение – это создание специальных алгоритмов, которые позволяют компьютерным программам самостоятельно учиться на больших объемах данных без постоянного вмешательства человека.

📌 Нейросети – наиболее сложный вид алгоритмов машинного обучения для создания AI. Нейросети состоят из единиц, называемых «нейронами», которые связаны друг с другом и могут передавать сигналы. А также из множества слоев, узлов и включают в себя миллиарды параметров, которые нужно учитывать в процессе обучения.

📌 NLP (Natural Language Processing) – способность языковой модели распознавать, обрабатывать и понимать человеческий язык. Это позволяет нам получать корректные ответы при общении с AI, ведь программа понимает, что мы хотим спросить.

📌 Параметры нейросети – это как миллионы учебников и правил, по которым она учится. Все то, что ей нужно учесть и не забыть в процессе обучения. И чем больше их, тем лучше и умнее модель (гипотеза). У GPT-4 более 2 триллионов параметров, у GigaChat — 29 миллиардов.

📌Промпт – это подробное описание задания или действия, которые должна выполнить нейросеть. Может быть представлен в виде текста, голоса или документа (по отдельности или вместе). Чем точнее промпт — тем эффективнее и корректнее ответ нейросети.

📌 Память нейросети – это способность модели сохранять информацию о предыдущих вопросах и отвечать на новые с учетом прошлой переписки, а не «с нуля». Нейросеть внимательна к этим деталям и может держать в уме то, о чем вы с ней говорили ранее, но в определенном объеме. У каждой нейросети есть свои ограничения «памяти».

📌 Поддержка контекста – это опция, которая включается в нейросети по вашему желанию и означает способность нейросети запоминать ваши предыдущие вопросы / ответы или начинать каждый раз все с нуля, не учитывая контекст. При необходимости ее можно отключить или включить обратно.

📌 Супер AI (Artificial Super Intelligence) или ASI – третий, еще более продвинутый, тип искусственного интеллекта, который превосходит человеческий интеллект во всех аспектах: творчество, общее знание, социальные навыки и т.д. На данный момент его не существует. И неизвестно возможно ли это.

📌 Токен – это единица информации, с помощью которой можно измерить ваш вопрос для нейросети и ее ответ, а также то, сколько всего информации может одномоментно запомнить программа.

📌 T9 – предиктивная (предугадывающая) система набора текстов для мобильных телефонов, которая предлагает вариант следующего слова, на основании внутреннего встроенного словаря. Название T9 происходит от англ. Text on 9 Keys, то есть набор текста на 9 кнопках.

📌 ChatGPT – специальный чат от компании OpenAI для прямого общения человека с LLM (GPT-3.5, GPT-4, GPT-4o) в виде сайта, приложения или в виде бота.

Спасибо, что вы изучили этот урок! Возвращайтесь обратно в наш образовательный бот «Нейрограмотность» @EDU4Telegrambot, ставьте ему оценку и переходите к следующему модулю!