Начало работы с Искусственным Интеллектом

Перед тем как начать создавать модель Искусственный Интеллект, давайте определимся с понятием искусственный интеллект, что это, и для чего он нужен?

Искусственный Интеллект(кратко ИИ) - свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека; Наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. (источник - Википедия)

На текущей день ИИ находит свое применение в различных областях, начиная от обычных небольших предприятий, таких как забегаловка в подъезде вашего дом заканчивая до самых крупнейших и развитых компаниях, таких как Microsoft. Главная цель ИИ это автоматизировать определенные процессы, и дать возможность компании работать намного эффективнее при этом обходится при минимальных затратах.

Работа с Google AI Studio

Шаг 1.

Переходим на официальный сайт Google AI Studio: https://aistudio.google.com/app/prompts/new_chat

Примечание:

Есть ограничения к доступу для определенных регионов. (В Казахстане работает)
Возрастное ограничение - 18 лет (кто младше 18 может спокойно в настройках Google-аккаунты изменить дату рождения)

Шаг 2.

В левой стороне у нас находится панель управления (рис. 1), для начало работы и некоторые документы и информации о том как работать с данной платформой.

Выбираем "Create new" создать новый

рис. 1 панель управления

Далее у нас выходит выбор Chat prompt, Freeform prompt, Structered prompt. (рис. 2)

рис. 2 виды обращений

Chat prompt - это наиболее популярный вариант, самый простой, где запросы походят на обычный разговор между людьми по Whatsapp.

Freeform prompt - чуть сложнее предыдущего варианта, но запросы пишется в специальной форме, ответ выдается в отдельной форме. В отличии от Chat prompt, тут у нас появляется возможность работы с фотографиями.

Structured prompt -

В данной статье, я научу вас работать с Freeform prompt, поэтому выбираем его.

Шаг 3.

Далее справа появится следующая панель для управления нашей моделей. (рис. 3)

рис. 3 правая панель управления

Первый Model, модель - предоставляет возможность выбрать определенную модель Gemini.

рис. 4 модели ИИ Gemini

Gemini Pro - работают исключительно с текстом. Тогда как, Gemini Pro Vision - работает с картинками и текстом, тем самым увеличивая возможности ИИ.

Выбрав Gemini Pro (работа с текстом) - можно поэкспериментировать и позадавать ИИ различные вопросы. К примеру рис. 5

рис. 5 Пример запросов

Запросы можно писать и на русском, но как показывает практика на данный момент ИИ лучше всего понимает английский язык. Поэтому, стоит подумать о том чтобы подучить английский язык.

Шаг 4.

Работать с текстом достаточно легко, написал запрос и ИИ вам прислал ответ. Усложним задачу добавляя картинку и спрашивая ИИ, что он видит на картинке.

Чтобы это сделать надо для начала выбрать модель ИИ Gemini Pro Vision(в панели управлении справа). Теперь пишем запрос... Перед тем как отправить запрос нажимаем на кнопку Image, картинка (чуть выше поля для ввода запросов, рис. 6). И выбираем любую доступную картинку(рис. 7).

рис. 6 панель с картинкой

рис. 7 Пример запроса с картинкой

Шаг 5.

Не менее важный параметр для работы с ИИ это его настройка. Есть такие параметры как Temparature(температура) - которая определяет точность ответа ИИ. Если поставить максимальное значение, то ответ может оказаться максимально широким, но при этом абсолютно не по теме. Если минимальное значение, то ИИ ответить максимально кратко, и только то в чем он уверен на 100%, если не уверен то ответит неправильно. Поэтому рекомендуется экспериментировать.

Max Outputs (максимальный ответ) - перевод немного некорректный, но в общем это позволяет получить сразу несколько ответов, тем самым сокращая времени на анализировании эффективности ИИ. В основном используется в тестировании для проверки модели.

Safety Settings (настройки защиты) - это настройка помогает ограничить или наоборот увеличить определенные параметры. Применение: к примеру вы создаете игровой диалог и с помощью данной настройки увеличить Danger (опасность) в диалоге при этом увеличивая атмосферность вашей игры.

Шаг 6.

Также есть такая опция как Test Input (тестирования входных данных), облегчает работу с большим количеством возможных данных. Вот пример использования рис. 8.

рис. 8 Пример использования Test Input

Посмотри на картинку и скажи - пишем в поле для ввода. Потом нажимаем Test Input, и потом вводим различные возможные запросы - что на нем? сколько свечей на нем? Таким образом легче и быстрее мониторить ответы при различных запросах.

Итог

В данной статье мы изучили понятие Искусственный Интеллект, его применение. Изучили как пользоваться модели Gemini Pro и Gemini Pro Vision. Рассмотрели разницу между различными моделями. Изучили базовые функции и возможности Google AI Studio, такие как Test Input. Поработали как с текстовыми данными так и картинками. Теперь вас действительно можно назвать modern person(современный человек).