обзор
January 23, 2023
Лучшее о подборе гиперпараметров к модели
Рассмотрим ключевые концепции в теме подбора гиперпараметров к модели машинного обучения. В первую очередь, это инструмент, который в зависимости от ситуации может меняться. Так, если параметров мало и датасет небольшой, то используйте GridSearchCV, если же ситуация обратная, то рекомендую применять RandomizedSearchCV с ограниченным количеством итераций. После нахождения области лучших параметров со вторым инструментом можно использовать более точечный подход с Optuna или Hyperopt.
Если применяете пайплайны sklearn для подбора гиперпараметров, в GridSearchCV и RandomizedSearchCV можно задать и поиск оптимальных этапов предобработки данных.
Ниже предлагаю конкретные ссылки, раскрывающие идеи использования подбора гиперпараметров:
- Общий подход к использованию GridSearchCV и RandomizedSearchCV
- Какие ключевые метрики собираются в ходе подбора и как их извлечь
- Подбор этапов предобработки данных
- Подбор параметров, используя механизм optimize objective Optuna
- Подбор параметров, используя механизм ask-tell Optuna
- Scikit-подобный интерфейс к использованию Optuna
- Подбор гиперпараметров модели с помощью Hyperopt