A função Pandas iloc() do Python
A função iloc[] da Biblioteca Python Pandas serve para selecionar dados dentro de um DataFrame do Pandas com base no seu índice. Desta forma, é possível visualizar linhas e colunas específicas de um DataFrame de acordo com a sua posição.
Sintaxe da propriedade iloc[] do Pandas
A propriedade iloc[] do Pandas aceita inteiros que especificam quais elementos do DataFrame devem ser selecionados. A sintaxe geral para DataFrame.iloc() é a seguinte:
DataFrame.iloc[selection]pythonPode passar para iloc[] um único inteiro, uma lista de inteiros em Python, um objeto de corte (slice) ou uma tupla com índices de linhas e colunas como parâmetros.
Utilização da propriedade Pandas DataFrame.iloc[]
O comportamento do iloc[] de Pandas varia de acordo com o valor que você passa para essa propriedade. Você entenderá melhor com a ajuda dos seguintes exemplos práticos:
Seleção de uma linha específica
O primeiro passo consiste em criar um DataFrame. Neste exemplo, estão incluídos os nomes de várias pessoas, a sua idade e o seu local de residência:
import pandas as pd
# Ejemplo de DataFrame
data = {'Nombre': ['Ana', 'Juan', 'Carla', 'David'],
'Edad': [28, 24, 22, 32],
'Ciudad': ['Barcelona', 'Madrid', 'Huelva', 'Castellón']}
df = pd.DataFrame(data)
print(df)pythonO DataFrame resultante tem a seguinte aparência:
Nombre Edad Ciudad
0 Ana 28 Barcelona
1 Juan 24 Madrid
2 Carla 22 Huelva
3 David 32 CastellónCom a ajuda do iloc[], pode selecionar qualquer linha. Para isso, basta indicar a linha desejada:
# Selección de la fila 0
result = df.iloc[0]
print(result)pythonNeste exemplo, seleciona-se a primeira linha (índice 0). O resultado mostra os dados de Ana:
Nombre Ana
Edad 28
Ciudad Barcelona
Name: 0, dtype: objectSeleção de uma linha e coluna específicas
Se, além do índice da linha, desejar especificar o índice da coluna, pode passar ambos os índices para iloc[] como parâmetros, separados por uma vírgula. Aqui está um exemplo:
# Selección de la fila 0 y la columna 1
result = df.iloc[0, 1]
print(result)pythonCom a chamada anterior à função iloc[] do Pandas, seleciona-se a primeira linha (índice 0) e a segunda coluna (índice 1). O resultado seria a idade de Ana: 28.
Seleção de várias linhas e colunas usando objetos de corte (slices)
O Pandas também permite selecionar várias linhas e colunas ao mesmo tempo com os objetos de corte do Python. Tenha em atenção que o índice que aparece após os dois pontos não é incluído na seleção.
# Selección de las dos primeras filas y las dos primeras columnas
result = df.iloc[0:2, 0:2]
print(result)pythonO resultado do código anterior seria:
Nombre Edad
0 Ana 28
1 Juan 24Aqui, foram selecionadas as duas primeiras linhas (0:2) e as duas primeiras colunas (0:2). O DataFrame resultante contém apenas os elementos correspondentes.
Seleção de linhas e colunas específicas utilizando listas
Como mencionámos anteriormente, também pode selecionar várias linhas e colunas utilizando listas Python. Este método apresenta uma vantagem em relação aos anteriores, pois permite selecionar áreas não contíguas do DataFrame.
# Selección de la primera y tercera fila, así como de la segunda y tercera columna
result = df.iloc[[0, 2], [1, 2]]
print(result)pythonNeste código, foram selecionadas a primeira e a terceira linhas ([0, 2]) e a segunda e a terceira colunas ([1, 2]). O resultado é o seguinte:
Edad Ciudad
0 28 Barcelona
2 22 Huelva