Pandas: Как выбрать первые N или последние N столбцов в DataFrame

Pandas является одной из самых популярных библиотек для работы с данными в языке программирования Python. Одним из ключевых объектов в Pandas является DataFrame – двумерная структура данных, которая представляет собой таблицу с метками строк и столбцов. Когда вы работаете с большими наборами данных, вам может потребоваться выбрать только несколько столбцов для анализа. В этой статье мы рассмотрим, как выбрать первые N или последние N столбцов в DataFrame.

Содержание показать

Основы работы с Pandas
Выбор первых N столбцов
1. Метод iloc
2. Использование срезов
Выбор последних N столбцов
1. Метод iloc
2. Использование отрицательных индексов
Заключение

Основы работы с Pandas {#basics}

Прежде чем начать работать с выборкой столбцов, нам нужно импортировать библиотеку Pandas и создать DataFrame.

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 35],
        'City': ['New York', 'London', 'Paris'],
        'Salary': [50000, 60000, 70000]}

df = pd.DataFrame(data)

Вот как выглядит наш DataFrame:

	Name	Age	City	Salary
0	Alice	25	New York	50000
1	Bob	30	London	60000
2	Charlie	35	Paris	70000

Теперь давайте перейдем к выборке первых и последних N столбцов.

Выбор первых N столбцов {#select-first-n-columns}

Чтобы выбрать первые N столбцов в DataFrame, у нас есть несколько способов.

Метод `iloc` {#method-iloc}

Метод iloc позволяет нам выбирать столбцы по их числовому индексу. Давайте посмотрим на примере, как выбрать первые два столбца.

first_two_columns = df.iloc[:, :2]

Новый DataFrame first_two_columns будет содержать только два первых столбца:

	Name	Age
0	Alice	25
1	Bob	30
2	Charlie	35

Читайте так же Как добавить год или годы к дате в Python: шаг-за-шагом инструкция

Использование срезов {#using-slices}

Мы также можем использовать срезы для выбора первых N столбцов. Вот как это можно сделать:

first_two_columns = df.iloc[:, 0:2]

Результат будет таким же, как и в предыдущем примере.

Выбор последних N столбцов {#select-last-n-columns}

Теперь рассмотрим выборку последних N столбцов в DataFrame.

Метод `iloc` {#method-iloc-2}

Как и в случае с выборкой первых N столбцов, мы можем использовать метод iloc и отрицательные числовые индексы для выборки последних N столбцов. Давайте посмотрим на примере:

last_two_columns = df.iloc[:, -2:]

Новый DataFrame last_two_columns будет содержать только два последних столбца:

	City	Salary
0	New York	50000
1	London	60000
2	Paris	70000

Использование отрицательных индексов {#using-negative-indexes}

Если вы предпочитаете использовать срезы, вы также можете использовать отрицательные индексы для выбора последних N столбцов:

last_two_columns = df.iloc[:, -2:-0]

Обратите внимание, что мы использовали -0 вместо -1, чтобы исключить последний столбец. Результат будет таким же, как и в предыдущем примере.

Заключение {#conclusion}

В этой статье мы рассмотрели, как выбрать первые N или последние N столбцов в Pandas DataFrame. Мы использовали метод iloc и срезы для выполнения этих операций. Вы можете выбрать нужные столбцы, указав их числовые индексы или используя отрицательные индексы для выборки последних столбцов.

Выборка только необходимых столбцов из большого набора данных может значительно упростить анализ и обработку данных. Теперь вы знаете, как сделать это с помощью библиотеки Pandas.

Надеюсь, данная статья была полезной и помогла вам в понимании выборки первых N или последних N столбцов в Pandas DataFrame. Удачи в ваших будущих проектах!

Оглавление

Основы работы с Pandas {#basics}

Выбор первых N столбцов {#select-first-n-columns}

Метод iloc {#method-iloc}

Использование срезов {#using-slices}

Выбор последних N столбцов {#select-last-n-columns}

Метод iloc {#method-iloc-2}

Использование отрицательных индексов {#using-negative-indexes}

Заключение {#conclusion}

Поделиться в социальных сетях

Похожие статьи

Метод `iloc` {#method-iloc}

Метод `iloc` {#method-iloc-2}