PythonTalk
@pythontalk
Добро пожаловать, если в сферу твоих интересов входят программирование на Python, data science и всякое смежное из IT.
289 posts
Статьи

GIL станет необязательным в Python 3.13

GIL (он же Global Interpreter Lock) может быть отключен в Python версии 3.13. Пока эта возможность является экспериментальной.

pip vs conda: сравнение двух пакетных менеджеров

Если вы используете Python для задач в области data science, то, вероятно, знакомы с двумя популярными пакетными менеджерами: pip и conda. Но, возможно, у вас возникали вопросы:

match-case в Python и почему он не так прост

Некоторые до сих пор утверждают, что Python не нуждается в синтаксисе "switch-case". Даже сам Гвидо не поддерживал его добавление. Однако почему он все же появился в версии 3.10? Причина может быть найдена в названии. Новый функционал называется "match case", а не "switch case", как в большинстве языков программирования.

Использование библиотеки missingno для поиска и визуализации пропусков в данных

Исследование и подготовка данных — важные этапы в любом data science. Учебные наборы данных часто создаются таким образом, чтобы упростить работу с ними. Однако в реальном мире данные обычно не идеальны: они могут содержать ошибки, неточности, пропуски и другие проблемы.

Прогнозирование временных рядов в Python

Анализ временных рядов (Time series analysis, TSA) – это метод изучения характеристик целевой переменной во времени, где время является независимой переменной.

Создаём Telegram бота с aiogram3 и llama3-7B

Итак, будем писать простого чат бота для telegram с локальной llama3 8B (даешь опенсорс!). Я всё буду делать на linux, какие-то не очевидные моменты для windows буду подсвечивать, в остальном - всё примерно тоже самое, я буду писать что конкретно делаю, а вы сможете загуглить, как оно там на винде работает - в 90% случаев команды те же самые. Предполагается, что вы можете создать и активировать виртуальное окружение самостоятельно, всё остальное я буду показывать поэтапно.

Метод главных компонент (PCA) в Python

Чем больше признаков (или "измерений") в наборе данных, тем больше требуется данных для получения статистически значимого результата. Это может привести к следующим проблемам в машинном обучении:

Polars: быстрая библиотека для работы с DataFrame

Polars — это высокопроизводительная библиотека для работы с DataFrame, спроектированная для эффективной и быстрой обработки данных. Вдохновлённая популярной библиотекой pandas, она предлагает еще более мощные возможности для работы с большими наборами данных, которые могут не поместиться в оперативную память.

Полиномиальная регрессия в sklearn

Полиномиальная регрессия - это форма линейной регрессии, в которой отношение между независимой переменной X и зависимой переменной y моделируется как многочлен n-й степени. Она используется когда отношение между признаками и целевой переменной не является линейным и связь лучше представить в виде кривой.

Как я в пятых тренировках по алгоритмам от Яндекса участвовала

Мой бэкграунд: