Python
October 15, 2023
Как сделать случайный отбор в Pandas?
Часто нужно сделать случайную выборку из данных. Например, чтобы протестировать модель на небольшом наборе данных или выбрать участников лотереи. Для этого в Pandas есть простые способы.
Загрузка данных
Сначала нужно загрузить данные в Pandas. Например, загрузим данные с тестового списка:
import pandas as pd data = pd.read_csv('testlist.csv')
Теперь в датафрейме data
у нас есть все данные из CSV-файла.
Случайный отбор
Чтобы выбрать случайные строки из датафрейма, используем метод sample()
.
Например, выберем 100 случайных строк:
random_rows = data.sample(n=100)
Метод sample()
выберет 100 случайных строк из датафрейма и запишет их в новый датафрейм random_rows
.
Можно также указать долю строк. Например, чтобы выбрать случайно 10% строк:
fraction_rows = data.sample(frac=0.1)