April 11, 2023

Введение в анализ данных. Теория вероятности. События.

Для начала работы зайдем в Colab. Для этого нам понадобиться Google аккаунт.

А дальше все просто, переходим по этой ссылке: https://colab.research.google.com/

Заходим в свой аккаунт Google.

Для работы создадим блокнот в котором мы и будем писать код.

Для дальнейшей работы посмотрите небольшой видео ролик чтобы в дальнейшем не ошибаться и понимать как работать с Colab

Что такое Анализ данных?

В мире, который столь сильно сосредоточен на информационных технологиях, огромные объемы информации и данных производятся и сохраняются каждый день

Часто их источником являются системы автоматического обнаружения, сенсоры и инструменты ученых. Как вариант — вы создаете их самостоятельно, даже не осознавая: снимаете деньги с банковского счета, осуществляете покупку, делаете запись в блоге или социальной сети

Но что такое данные?

Данные — это не информация, по крайне мере, по меркам их формы. В бесформенном потоке байтов на первый взгляд сложно понять их суть вне чисел, слов или времени, которое они представляют

Информация — это результат обработки с учетом определенного набора данных. Она предлагает определенные выводы, которые затем разными способами могут быть использованы. Этот процесс извлечения информации из сырых данных и называется анализом данных

Цель анализа данных — извлекать информацию, которую не просто истолковать, но которая, если ее понять, поможет проводить исследования. Такие исследования в свою очередь дадут возможность понять системы, ответственные за создание данных и в будущем делать прогнозы относительно работы систем и их развития

Модели

Так же одной из важных частей анализа данных является модель.

Модель - это перевод изучаемой системы в математическую формулу.

Когда есть математическая или логическая форма, которая может описывать реакции системы на разные уровни давления, появляется возможность делать предсказания о её развитии или ответах на определенные вводные данные. Поэтому цель анализа данных - это не модель, а качество силы предсказания.

Визуализация данных

Пока что речь шла только о данных, работе с ними и обработке с помощью математических операций. Параллельно этим этапам анализа данных развивались различные способы визуализации данных Чтобы понять данные — конкретно и то, какую роль они играют в общей картине — нет лучшего способа, чем разработка графического представления Такая репрезентация способна превращать информацию, иногда неявно скрытую, в схемы, которые помогают проще ее понять. В течение лет было разработано множество моделей отображения. Они получили название графиков.

Теория вероятности.

Скорее всего многие слышали да и проходили данную тему на уроках математики.

Теория вероятности - раздел математики, изучающий случайные события, случайные величины, их свойства и операции над ними.

Событие и виды событий

Событие — это базовое понятие теории вероятности. События бывают достоверными, невозможными и случайными.

Достоверным является событие, которое в результате испытания обязательно произойдет. Например, камень упадет вниз.

Невозможным является событие, которое заведомо не произойдет в результате испытания. Например, камень при падении улетит вверх.

Случайным называется событие, которое в результате испытания может произойти, а может не произойти. Например, из колоды карт вытащили туза.

Есть также псевдо случайное событие - это случайное событие которое использует математические алгоритмы и его можно просчитать заранее.

Алгебра событий

Есть так же свойства вероятностей.

1. Вероятность достоверного события равна единице .

2. Вероятность невозможного события равна нулю .

3. Вероятность случайного события есть положительное число, заключенное между нулем и единицей.

Общая формула:

P (A) = m/n

n — общее число всех равновозможных, элементарных исходов этого испытания

m — количество элементарных исходов, благоприятствующих событию A

Примеры:

Разберем один пример чтобы понимать как же считать вероятность.

Бросают игральный кубик. Какова вероятность, что выпадет 3 очка? Решение. Количество элементарных исходов n=6. Событие A - выпадение трёх очков. Число случаев, благоприятствующих событию A равно m = 1. Получаем:

P(A)= m/n = 1/6

Ответ:" 1/6