Введение в анализ данных. Теория вероятности. События.
Для начала работы зайдем в Colab. Для этого нам понадобиться Google аккаунт.
А дальше все просто, переходим по этой ссылке: https://colab.research.google.com/
Заходим в свой аккаунт Google.
Для работы создадим блокнот в котором мы и будем писать код.
Для дальнейшей работы посмотрите небольшой видео ролик чтобы в дальнейшем не ошибаться и понимать как работать с Colab
Что такое Анализ данных?
В мире, который столь сильно сосредоточен на информационных технологиях, огромные объемы информации и данных производятся и сохраняются каждый день
Часто их источником являются системы автоматического обнаружения, сенсоры и инструменты ученых. Как вариант — вы создаете их самостоятельно, даже не осознавая: снимаете деньги с банковского счета, осуществляете покупку, делаете запись в блоге или социальной сети
Но что такое данные?
Данные — это не информация, по крайне мере, по меркам их формы. В бесформенном потоке байтов на первый взгляд сложно понять их суть вне чисел, слов или времени, которое они представляют
Информация — это результат обработки с учетом определенного набора данных. Она предлагает определенные выводы, которые затем разными способами могут быть использованы. Этот процесс извлечения информации из сырых данных и называется анализом данных
Цель анализа данных — извлекать информацию, которую не просто истолковать, но которая, если ее понять, поможет проводить исследования. Такие исследования в свою очередь дадут возможность понять системы, ответственные за создание данных и в будущем делать прогнозы относительно работы систем и их развития
Модели
Так же одной из важных частей анализа данных является модель.
Модель - это перевод изучаемой системы в математическую формулу.
Когда есть математическая или логическая форма, которая может описывать реакции системы на разные уровни давления, появляется возможность делать предсказания о её развитии или ответах на определенные вводные данные. Поэтому цель анализа данных - это не модель, а качество силы предсказания.
Визуализация данных
Пока что речь шла только о данных, работе с ними и обработке с помощью математических операций. Параллельно этим этапам анализа данных развивались различные способы визуализации данных Чтобы понять данные — конкретно и то, какую роль они играют в общей картине — нет лучшего способа, чем разработка графического представления Такая репрезентация способна превращать информацию, иногда неявно скрытую, в схемы, которые помогают проще ее понять. В течение лет было разработано множество моделей отображения. Они получили название графиков.
Теория вероятности.
Скорее всего многие слышали да и проходили данную тему на уроках математики.
Теория вероятности - раздел математики, изучающий случайные события, случайные величины, их свойства и операции над ними.
Событие и виды событий
Событие — это базовое понятие теории вероятности. События бывают достоверными, невозможными и случайными.
Достоверным является событие, которое в результате испытания обязательно произойдет. Например, камень упадет вниз.
Невозможным является событие, которое заведомо не произойдет в результате испытания. Например, камень при падении улетит вверх.
Случайным называется событие, которое в результате испытания может произойти, а может не произойти. Например, из колоды карт вытащили туза.
Есть также псевдо случайное событие - это случайное событие которое использует математические алгоритмы и его можно просчитать заранее.
Алгебра событий
Есть так же свойства вероятностей.
1. Вероятность достоверного события равна единице .
2. Вероятность невозможного события равна нулю .
3. Вероятность случайного события есть положительное число, заключенное между нулем и единицей.
Общая формула:
n — общее число всех равновозможных, элементарных исходов этого испытания
m — количество элементарных исходов, благоприятствующих событию A
Примеры:
Разберем один пример чтобы понимать как же считать вероятность.
Бросают игральный кубик. Какова вероятность, что выпадет 3 очка? Решение. Количество элементарных исходов n=6. Событие A - выпадение трёх очков. Число случаев, благоприятствующих событию A равно m = 1. Получаем: