September 21, 2022

Pandas

Содержание

Вниз

Метод pd.Series

Легче всего оформлять Series из словаря. В этом случае ключи выступят индексами.

Можно делать также по другому:

life_long_average = pd.Series([84.7, 84.5, 83.7], ['Hong Kong', 'Japan', 'Singapore'])

Dataframes

pd.DataFrame

Красный - данные, синий - индексы строк, оранжевый - индексы столбцов. Кол-во столбцов и их индексов должно быть одинаковым. Как и у строк.

Выбор столбцов:

Создание нового столбца:

Создали столбец и определили для него данные.
Создали столбик green и определили ему значения как сумму данных столбцов blue и violet

Работа со строками:

Если используем функцию iloc , то выбирается строка по индексу [0,1,2,3 ....] , не по наименованию индекса, которое задается в определении все dataframe.
Срокам можно присваивать новые данные
Чтобы выбрать данные ячейки по строке, следует указать строку, а потом столбец:
Выводим данные по нескольким строкам и столбцам. Сначала в виде списка указываем строки, потом столбцы.

Удаление строк

my_df.drop(3, inplace=True)
Строка 3 удалилась из всей базы т.к. параметр inplace = True.

Удаление столбцов

Информация о таблице (dataframe):

pd.Series - таблица series

df.drop()

df['Orange'] и df['Orange', 'Green'] - выбор столбцов

df.loc[2] - выбор строк

df['Violet'] = [<значения для столбца Violet]

df.loc[[2,3],['Orange', 'Green']] - выбор значений со строк 2 и 3 по указанным столбцам

df.loc[2, 'Orange] - выбор одного значения

Вверх

Содержание