Полиномиальная регрессия в машинном обучении
https://sunandstuff.com/atest/ai/classification/
Нужна для того, чтобы делать прогнозы на основе каких-то данных.
В этой визуализации левой кнопкой мыши ставятся точки одного класса, правой — другого. Модель пытается описать все пространство вокруг этих точек уравнением нужной степени (первый ползунок). Чем больше степень — тем кудрявее может быть рельеф. Например, если поставить одну тёмную точку то модель скажет «ну, основываясь на том, что мне известно, всё пространство — пространство тёмных точек. Предсказываю, что куда ни ткни — точка будет тёмной». Но если поставить еще одну точку, белую, модель обновится: «ой, кажется, что, все-таки, вот тут все точки будут светлыми, а тут — тёмными.» Ползунок «Learning rate» определяет насколько смело модель меняет себя, получив новые данные. Регуляризация — суперважная штука для постоения правдоподобных моделей. Она не дает модели зазубрить те данные, которые у нее есть, уйти в себя и построить нереалистичную модель. Регуляризация L1 уменьшает важность тех частей полинома, которые не особо влияют на результат и усиливает те, что влияют. Например, если выбрать preset data «Ring», то без регуляризации получится какое-то мудрёное пятно, а если подкрутить немного регуляризации, то пятно свернется в красивый мутный круг. L2 чморит модель за слишком большие коэффициенты у полинома, типа «давай опиши то, что видишь, как-нибудь без капса». Не смотря на то, что с регуляризацией ошибка модели получается больше, предсказания такой модели для новых данных получаются точнее.