March 30, 2020

Шесть лучших финансовых библиотек для Python

Python — востребованный язык в сфере финансов. Но сам по себе он не обладает тем количеством возможностей, которые привносят более 50 встроенных модулей. Например, если вам потребуется рассчитать кривую дисконтирования, то для этого необходимо будет привлечь экспоненциальную и логарифмическую функции, которые предоставляет встроенный математический модуль.

Встроенных модулей будет достаточно для того минимума работы, который ожидается от среднего кванта: анализа данных, моделирования, ретрополяции и установки цены опционов. Для более серьезных и специализированных задач, знание которых могут потребоваться для работы программистом в банке или другом финансовом учреждении, существуют тысячи сторонних библиотек. Ниже мы собрали шесть наиболее функциональных из них, которые смогут значительно расширить ваш арсенал.

NumPy

NumPy является базовым модулем для выполнения финансовых расчетов с помощью Python. На 2018 год NumPy входил в семерку наиболее популярных модулей, на данный же момент трудно найти финансиста, который бы с ним не работал. Библиотеки NumPy позволяют манипулировать матрицами и массивами, задействовать функции генератора случайных чисел, необходимые для определенных техник оптимизации вроде бустинга и бэггинга. Стоит отметить, что значительная часть основного кода здесь написана на C, что позволяет сгладить характерную для Python медлительность.

SciPy

SciPy собран из базовых функций NumPy, и крайне удобен в обработке финансовых данных, а также техниках обработки сигнала, линейной алгебре, статистике, интерполяции и оптимизации.

Matplotlib

Помимо обработки данных, не лишней будет возможность детально их изучить, и здесь на помощь приходит Matplotlibownload.htl, модуль визуализации, позволяющий создавать все виды таблиц и графиков в двух или трех измерениях. Не самый простой в освоении модуль, но если вы уже знакомы с Matlab, то проблем не возникнет — интерфейс Matplotlib во многом повторяет его. В любом случае, время, затраченное на освоение этого непростого модуля, всегда оправдывает себя, предоставляя пользователю самый широкий спектр возможностей по визуализации.

Pandas

Pandas, основанный на SciPy и NumPy, является достаточно распространенной библиотекой для работы с данными и их анализом. Pandas отлично показывает себя в управлении временными данными, и является незаменимым инструментов для отслеживания изменений цен с течением времени. Важно отметить, что изначально модуль pandas создавался разработчиками AQR, и лишь впоследствии перешел в открытый доступ.

В сумме NumPy, SciPy, matplotlib и pandas составляют популярный пакет, обычно именуемый просто как NumPy / SciPy. Несмотря на популярность самого пакета, его установка связана со значительными сложностями, и часто рекомендуется устанавливать его посредством Anaconda для последующего запуска в виртуальной среде. Проблема, однако, в том, что помимо NumPy / SciPy Anaconda устанавливает еще более 200 библиотек, что может поставить под вопрос эффективность этого метода.

Scikit-learn

Еще один модуль из состава Anaconda для тех, кто собирается равиваться в направлении ИТ, в 2008 году признанный самым популярным модулем машинного обучения для Python. Классификация, кластеринг и другие популярные техники машинного обучения здесь подаются с визуализацией matplotlib, основной же код базируется на уже упоминавшихся NumPy и SciPy.

QuantLib

Значительная часть квантов работает в оценке и структурировании, и для них в Python доступна QuantLib, одна из наиболее востребованных библиотек для C++ для операций оценки и расчета финансовых деривативов. Среди преимуществ QuantLib однозначно выделяется характерная для кода в C++ быстрота, но отсутствие специализированной документации для Python делает освоение этого модуля достаточной непростой задачей. Однако и она оправдывает затраченные усилия, предоставляя быстрый и доступный инструмент для оценки в повседневной деятельности трейдера, где библиотека, написанная исключительно на Python, оказалась бы непростительно медленной.