Pandas
February 21, 2024

Удаление из таблицы строк/столбцов. Pandas

Удалить из таблицы строку или столбец можно методом
.drop( *что удаляем*, axis= *по строкам или столбцам*).

Казалось бы, с чем могут возникнуть трудности?

Чтобы удалить столбцы, достаточно указать в ‘___’ имя столбца.

А если мы хотим удалить строки, то методу нужно указать, что именно мы хотим удалить и добавить axis=1, потому что:

axis =
0 – это удаление строк (по умолчанию, если axis не писать)
1 – это удаление столбцов.

А подробнее, как удалить строки?

  • Создать переменную с указанием индекса строк, которые хотим удалить (вручную долго)

  • Создать переменную с указанием условия по которому отберем строки, которые хотим удалить (уже лучше)
  • Указать условие внутри метода .drop()
    (с одной стороны меньше кода и меньше переменных, с другой – тяжелее читать код, но тоже допустимо)
  • Создать переменную и использовать в ней функцию.
    (если условие выбора сложное и нужно произвести какое-то действие)

И последнее, не забываем, зачем мы делаем изменения в таблице. Скорее всего, для того, чтобы сохранить изменения и работать с ними дальше.

Как сохраняемся:

  • В новую переменную.
    Если не хотим менять исходную таблицу
  • Перезаписываем таблицу в ту же переменную. Что по действиям то же самое, что в абзаце выше. Разница в скорости выполнения и использовании памяти, что может быть заметно в работе с большим количеством данных.
  • Без перезаписи, удаляя строки в исходной таблице, используя параметр inplace=True в методе .drop(). Этот параметр указывает Pandas на то, что удаление должно быть выполнено непосредственно в исходном DataFrame, а не возвращено как новый DataFrame.
    Полезно в том случае, если чистим чистим данные, т.е. готовим к дальнейшей работе