Python
October 15, 2023

Как сделать случайный отбор в Pandas?

Часто нужно сделать случайную выборку из данных. Например, чтобы протестировать модель на небольшом наборе данных или выбрать участников лотереи. Для этого в Pandas есть простые способы.

Загрузка данных

Сначала нужно загрузить данные в Pandas. Например, загрузим данные с тестового списка:

import pandas as pd

data = pd.read_csv('testlist.csv')

Теперь в датафрейме data у нас есть все данные из CSV-файла.

Случайный отбор

Чтобы выбрать случайные строки из датафрейма, используем метод sample().

Например, выберем 100 случайных строк:

random_rows = data.sample(n=100)

Метод sample() выберет 100 случайных строк из датафрейма и запишет их в новый датафрейм random_rows.

Можно также указать долю строк. Например, чтобы выбрать случайно 10% строк:

fraction_rows = data.sample(frac=0.1)