"Глубокое обучение. Погружение в мир нейронных сетей" Сергей Николенко, Артур Кадурин, Екатерина Архангельская
тренировка мозга онлайн (promo)
“Два основных класса задач машинного обучения — это задачи обучения с учителем (supervised learning) и обучения без учителя (unsupervised learning). При обучении с учителем на вход подается набор тренировочных примеров, который обычно называют обучающим или тренировочным набором данных (training set или training sample - тренировочная выборка), и задача состоит в том, чтобы продолжить уже известные ответы на новый опыт, выраженный обычно в виде тестового набора данных (test set, test sample).”
“в поисковых и рекомендательных системах часто встречается задача обучения ранжирования (learning to rank). Она ставится так: по имеющимся данным (в поисковой системе это будут тексты документов и прошлое поведение пользователей) отранжировать, расставить имеющиеся объекты в порядке убывания целевой функции (в поисковой системе она называется релевантностью: насколько данный документ подходит, чтобы выдать его в ответ на данный запрос).”
“И наконец, третий и самый общий класс задач обучения без учителя - задача оценки плотности: нам даны точки данных (х1, …,хм} и, возможно, какие-то априорные представления о том, откуда взялись эти точки, а хочется оценить распределение р(х), из которого они получились. Это очень общая постановка задачи, к ней можно многое свести, и нейронные сети тоже отчасти ее и решают.”
“в нашем мозге содержится порядка … (сто триллионов) синапсов.”
“на самом деле мы очень плохо понимаем, как работает настоящий человеческий мозг, и искусственные нейронные сети - это не попытка приблизиться к реальной структуре, а достаточно абстрактные модели, созданные для решения оптимизационных задач.”
“В. Гейзенберг. Физика и философия. Часть и целое”
“Условная вероятность - вероятность наступления одного события, если из-вестно, что произошло другое, р(х | у); ее обычно определяют формально так: P(x | y) = Р(х, y) / Р(y)”
“теорема Байеса — это основной, центральный инструмент машинного обучения, на ней держатся буквально все рассуждения этой книги и многие другие.”
“математическая модель в машинном обучении обычно представляет собой задание распределения вероятностей на данных и параметрах р(Q, D);”
“градиент — это то направление, в котором функция быстрее всего возрастает.”