February 4
Запуск Llama 3.1 70b и 3.1 8b через Yandex облако
Я уже ранее делал обзор библиотеки Yandex Cloud ML SDK для работы с YandexGPT и прочими инструментами. И Yandex облако добавили возможность использовать Llama 3.1 двух версий через их API.
Компания Meta признана в России экстремистской организацией и запрещены в РФ 21.03.2022
Я не буду вдаваться сильно в подробности работы с библиотекой, так как обзор уже делал ни раз. Вам потребуется знать id каталога внутри Yandex Cloud и API ключ для работы с AI.
Сначала импортируем нужные библиотеки и прочитаем ключи.
import asyncio
import os
from dotenv import load_dotenv
from yandex_cloud_ml_sdk import AsyncYCloudML
load_dotenv()
yandex_folder_id = os.getenv('YANDEX_FOLDER_ID')
yandex_api_key = os.getenv('YANDEX_AI_API_KEY')
# Создание экземпляра SDK
sdk = AsyncYCloudML(folder_id=yandex_folder_id, auth=yandex_api_key)Далее просто сделаем функцию, которая будет в консоли симулировать чат:
async def main():
model = sdk.models.completions('llama')
model = model.configure(temperature=0.5)
messages: list[dict[str, str] | str] = [
{'role': 'system', 'text': 'Ты - Заботливый помощник'}
]
while True:
message = input('User: ')
if message == 'стоп':
break
messages.append(message)
result = await model.run(messages)
messages.append(result[0])
print('AI: ', result[0].text, '\n')
if __name__ == '__main__':
asyncio.run(main())Меняя модель можно провести эксперименты, какая отвечает лучше.
На этом всё :) Подписывайтесь на телеграм канал, чтобы не пропускать обновления.