Como selecionar dados usando Pandas loc[]

Tabela de Conteúdos

Na biblioteca Python Pandas, o indexador DataFrame.loc[] permite selecionar os dados de um DataFrame usando marcadores. Isso facilita a extração de linhas e colunas específicas.

Web hosting

Get your site online fast without breaking the bank

Fast page loads while cutting costs by 60%
Keep your site open 24/7 with 99.99% uptime
Never run out of space with unlimited storage

Sintaxe do indexador Pandas `loc[]`

O indexador Pandas loc[] tem uma sintaxe muito simples. Para usá-la, basta informar os marcadores (labels) das colunas e linhas que você deseja selecionar como parâmetro:

DataFrame.loc[seleção]

python

NO indexador Pandas loc[], as seleções são feitas usando rótulos de índice, também chamados de marcadores. Isso significa que o parâmetro informado pode ser um marcador único, uma lista ou um slice de marcadores. Arrays booleanos também podem ser usados.

Diferença entre `loc[]` e `iloc[]`?

Enquanto o indexador Pandas DataFrame.loc[] seleciona os dados com base em marcadores, DataFrame.iloc faz a seleção a partir de posições baseadas em números inteiros. Veja este exemplo que ilustra a diferença de ambas. Primeiro, vamos criar um DataFrame no Pandas:

import pandas as pd
# Exemplo de DataFrame
data = {'Nome': ['Andreia' , 'Bruno', 'Carla'], 'Idade': [23, 35, 30]}
df = pd.DataFrame(data)
print(df)

python

O DataFrame ficará assim:

Nome   Idade
0 Andreia     23
1 Bruno        35
2 Carla         30

Para extrair “Andreia” do DataFrame, podemos usar tanto O indexador Pandas loc[] quanto iloc[]. Embora a abordagem seja diferente, o resultado será o mesmo:

# Usar loc e marcadores para extrair Andreia
print(df.loc[0, 'Nome'])  # Output: 'Andreia'
# Usar iloc e inteiros para extrair Andreia
print(df.iloc[0, 0])  # Output: 'Andreia'

python

Como usar Pandas `DataFrame.loc[]`

O indexador Pandas loc[] possibilita extrair conjuntos de dados de um DataFrame. Com ele, é possível extrair uma única linha ou coluna, várias linhas e colunas ao mesmo tempo, ou até aplicar filtros baseados em condições. Toda essa flexibilidade faz com que esse indexador seja a solução ideal em diversos casos.

Selecionar uma linha única

Considere este exemplo de DataFrame:

import pandas as pd
data = {
    'Nome': ['Andreia', 'Bruno', 'Carla'],
    'Idade': [23, 35, 30],
    'Cidade': ['Santos', 'Blumenau', 'Fortaleza']
}
df = pd.DataFrame(data)
print(df)

python

Este será o DataFrame resultante do código acima:

Nome  Idade     Cidade
0   Andreia 23       Santos
1   Bruno    35       Blumenau
2   Carla      30       Fortaleza

Para selecionar os dados da linha que contém as informações sobre Bruno (índice 1), use O indexador Pandas loc[]:

dados_bruno = df.loc[1]
print(dados_bruno)

python

Este será o resultado:

Nome         Bruno
Idade              35
Cidade       Blumenau
Nome: 1, dtype: object

Selecionar múltiplas colunas

Também é possível usar o indexador Pandas DataFrame.loc[] para selecionar um conjunto de colunas. O código a seguir resultará na seleção das colunas “Nome” e “Cidade”:

nome_cidade = df.loc[:, ['Nome', 'Cidade']]
print(nome_cidade)

python

O resultado será um subconjunto do DataFrame original:

Nome    Idade
0  Andreia    23
1  Bruno      35
2  Carla      30

Selecionar linhas com base em condições

O indexador Pandas loc[] também possibilita selecionar linhas que atendam a critérios específicos. Isso é feito usando operadores booleanos de comparação. Por exemplo, aqui está um exemplo de como filtrar indivíduos com mais de 25 anos:

mais_25 = df.loc[df['Idade'] > 25]
print(mais_25)

python

O código acima produzirá um DataFrame que incluirá apenas os dados das pessoas com mais de 25 anos:

Nome   Idade    Cidade
1 Bruno     35       Blumenau
2 Carla       30       Fortaleza

Artigos Populares

Como ganhar dinheiro com domínios?

Comprar e vender domínios pode ser muito lucrativo, basta saber como fazer. Descubra como…

Leia mais

Comparação: Top 5 alternativas ao Nextcloud

Você está procurando alternativas ao Nextcloud, mas quer saber se elas estão à altura?…

Leia mais

Comparação: As melhores ferramentas de backup on-line

Salve seus dados de forma segura com o melhor app de backup em nuvem. Nossa comparação…

Leia mais

As melhores alternativas grátis ao InDesign

Você acha os produtos da Adobe muito caros? Conheça alternativas gratuitas ao InDesign,…

Leia mais

Pandas DataFrame: Manipular tabelas em Python

O módulo Pandas é uma das ferramentas mais poderosas para manipulação de dados em Python e uma de suas estruturas de dados centrais é o DataFrame. Com o Pandas DataFrame, é possível manipular dados estruturados bidimensionais de maneira eficiente e organizada. Vamos explicar, com…

Python Pandas

Leia mais

Mr. Kosalshutterstock

Como usar o Pandas DataFrame index no Python

O Pandas DataFrame index é uma poderosa ferramenta de manipulação de dados. Ao aplicar diferentes métodos, você poderá trabalhar com dados e subconjuntos específicos no seu DataFrame. Neste artigo, explicamos o que é o Pandas DataFrame index, como acessar dados em colunas e…

Python Pandas

Leia mais

BEST-BACKGROUNDSShutterstock

Como percorrer DataFrames com Pandas iterrows()

A função Pandas DataFrame.iterrows() é uma ferramenta útil para percorrer linhas de um DataFrame, principalmente nos casos em que processamentos de dados se fazem necessários. O Pandas iterrows() é especialmente útil para a realização de cálculos ou lógicas condicionais. Conheça…

Python Pandas

Leia mais

ra2 studioShutterstock

Pandas table: Como formatar DataFrames em tabelas

Exibir um Pandas DataFrame como tabela é essencial, e a ação pode ser realizada de diferentes formas. Seja um resultado simples exibido no próprio console, uma tabela HTML formatada ou variados formatos padronizados, como texto simples e GitHub Markdown, o Pandas permite criar…

Python Pandas

Leia mais

Mr. Kosalshutterstock

O que é a função Pandas any() em Python e como ela funciona?

A função Pandas any() é uma ferramenta eficiente para verificar, com rapidez, se pelo menos um valor no DataFrame é verdadeiro. Ela é especialmente útil em processos de análise e validação de dados. Neste artigo, apresentamos a sintaxe dessa função, ensinamos você a usá-la e…

Python Pandas

Leia mais

Ranjit Karmakarshutterstock

O que é a função Pandas DataFrame describe()?

A função Pandas DataFrame.describe() gera um resumo estatístico abrangente baseado nos dados numéricos de um DataFrame. Ela permite ajustar o percentis e especificar os tipos de dados, por isso é considerada uma ferramenta bastante flexível e adequada para desempenhar uma ampla…

Python Pandas

Leia mais

Como se­le­ci­o­nar dados usando Pandas loc[]

Sintaxe do indexador Pandas loc[]

Diferença entre loc[] e iloc[]?

Como usar Pandas DataFrame.loc[]

Se­le­ci­o­nar uma linha única

Se­le­ci­o­nar múltiplas colunas

Se­le­ci­o­nar linhas com base em condições

Como selecionar dados usando Pandas loc[]

Sintaxe do indexador Pandas `loc[]`

Diferença entre `loc[]` e `iloc[]`?

Como usar Pandas `DataFrame.loc[]`

Selecionar uma linha única

Selecionar múltiplas colunas

Selecionar linhas com base em condições