Pandas 2. Операции.MultiIndex.
Два формата записи:
database>48 выведет boolean значения
database[database>48] выведет значения числовые
Проверка данных в отдельных столбцах и строках
db['Spain']>60 - получим bool значения
db[db['Spain']>60] - получим числовые значения. Однако, значения будут не для указанного столбца 'Spain', а для все строк см. рисунок.
Чтобы вывести данные по одному или по нескольким стобцам, надо добавить название столбца в конце.
Для нескольких стобцов: db[db['Spain']>60][['Spain','Italy']]
Для использования нескольких условий в выборке используем следующие команды:
db[(db['Germany']>70) & (db['France']<10)]
Также можно использовать операнд "или":
db.reset_index()
Для записи в базу параметр inplace должен быть = True
Добавить новый столбец с данными:
ind = ['aa','bb','cc','dd','ff','gg','ee'] db['New'] = ind
Теперь назначим New главным индексом db.set_index('New')
MultiIndex
Пример массива с мультииндексом:
mult_ind_df.loc['T1'].loc[2] - выбор строки по одному и по второму индексу
df.loc['C'].loc['left']['X'] - выбор значения из определенного столбика
mult_ind_df.index.names = ['Types', 'Numbers'] - присвоить имена индексам
Команда .xs позволяет залазить "внутрь" массива
mult_ind_df.xs(2, level='Numbers')
Index:
database>48 выведет boolean значения
database[database>48] выведет значения числовые
db['Spain']>60 - получим bool значения в отдельном столбце
db[db['Spain']>60] - получим численные значения в отдельном столбце
db[db['Spain']>60][['Spain','Italy']] - значения для нескольких столбцов
db[(db['Germany']>70) & (db['France']<10)] - несколько условий
db.reset_index() - переиндексация строк
db.set_index('New') - назначение главным индексом
mult_ind_df.loc['T1'].loc[2] - выбор строки по одному и по второму индексу
df.loc['C'].loc['left']['X'] - выбор значения из определенного столбика
mult_ind_df.index.names = ['Types', 'Numbers'] - присвоить имена индексам
mult_ind_df.xs(2, level='Numbers') - перекрестные значения