Pandas: Как выбрать первые N или последние N столбцов в DataFrame

Pandas: Как выбрать первые N или последние N столбцов в DataFrame


Pandas является одной из самых популярных библиотек для работы с данными в языке программирования Python. Одним из ключевых объектов в Pandas является DataFrame – двумерная структура данных, которая представляет собой таблицу с метками строк и столбцов. Когда вы работаете с большими наборами данных, вам может потребоваться выбрать только несколько столбцов для анализа. В этой статье мы рассмотрим, как выбрать первые N или последние N столбцов в DataFrame.

Оглавление

  1. Основы работы с Pandas
  2. Выбор первых N столбцов
    1. Метод iloc
    2. Использование срезов
  3. Выбор последних N столбцов
    1. Метод iloc
    2. Использование отрицательных индексов
  4. Заключение

Основы работы с Pandas {#basics}

Прежде чем начать работать с выборкой столбцов, нам нужно импортировать библиотеку Pandas и создать DataFrame.

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 35],
        'City': ['New York', 'London', 'Paris'],
        'Salary': [50000, 60000, 70000]}

df = pd.DataFrame(data)

Вот как выглядит наш DataFrame:

Name Age City Salary
0 Alice 25 New York 50000
1 Bob 30 London 60000
2 Charlie 35 Paris 70000

Теперь давайте перейдем к выборке первых и последних N столбцов.

Выбор первых N столбцов {#select-first-n-columns}

Чтобы выбрать первые N столбцов в DataFrame, у нас есть несколько способов.

Метод iloc {#method-iloc}

Метод iloc позволяет нам выбирать столбцы по их числовому индексу. Давайте посмотрим на примере, как выбрать первые два столбца.

first_two_columns = df.iloc[:, :2]

Новый DataFrame first_two_columns будет содержать только два первых столбца:

Name Age
0 Alice 25
1 Bob 30
2 Charlie 35
Читайте так же  Как добавить год или годы к дате в Python: шаг-за-шагом инструкция

Использование срезов {#using-slices}

Мы также можем использовать срезы для выбора первых N столбцов. Вот как это можно сделать:

first_two_columns = df.iloc[:, 0:2]

Результат будет таким же, как и в предыдущем примере.

Выбор последних N столбцов {#select-last-n-columns}

Теперь рассмотрим выборку последних N столбцов в DataFrame.

Метод iloc {#method-iloc-2}

Как и в случае с выборкой первых N столбцов, мы можем использовать метод iloc и отрицательные числовые индексы для выборки последних N столбцов. Давайте посмотрим на примере:

last_two_columns = df.iloc[:, -2:]

Новый DataFrame last_two_columns будет содержать только два последних столбца:

City Salary
0 New York 50000
1 London 60000
2 Paris 70000

Использование отрицательных индексов {#using-negative-indexes}

Если вы предпочитаете использовать срезы, вы также можете использовать отрицательные индексы для выбора последних N столбцов:

last_two_columns = df.iloc[:, -2:-0]

Обратите внимание, что мы использовали -0 вместо -1, чтобы исключить последний столбец. Результат будет таким же, как и в предыдущем примере.

Заключение {#conclusion}

В этой статье мы рассмотрели, как выбрать первые N или последние N столбцов в Pandas DataFrame. Мы использовали метод iloc и срезы для выполнения этих операций. Вы можете выбрать нужные столбцы, указав их числовые индексы или используя отрицательные индексы для выборки последних столбцов.

Выборка только необходимых столбцов из большого набора данных может значительно упростить анализ и обработку данных. Теперь вы знаете, как сделать это с помощью библиотеки Pandas.

Надеюсь, данная статья была полезной и помогла вам в понимании выборки первых N или последних N столбцов в Pandas DataFrame. Удачи в ваших будущих проектах!