O Python Pandas é uma bi­bli­o­teca de código aberto de­sen­vol­vida es­pe­ci­al­mente para análise e ma­ni­pu­la­ção de dados. Ela oferece aos pro­gra­ma­do­res es­tru­tu­ras e funções que sim­pli­fi­cam o trabalho com tabelas numéricas e séries temporais.

Nomes de domínio por US$ 1

Registre ótimos TLDs por menos de US$ 1 no primeiro ano. Esperar para quê? Garanta seu nome de domínio preferido hoje mesmo.

  • inscrição fácil
  • Cer­ti­fi­cado SSL
  • Suporte 24 horas por dia, 365 dias por ano

Para que serve o Python Pandas?

A bi­bli­o­teca Pandas é am­pla­mente utilizada em di­fe­ren­tes áreas de pro­ces­sa­mento de dados graças às suas fun­ci­o­na­li­da­des que oferecem suporte a diversas apli­ca­ções:

  • Análise ex­plo­ra­tó­ria de dados (AED): o Python Pandas facilita a ex­plo­ra­ção e a com­pre­en­são geral dos conjuntos de dados. Com funções como describe(), head() e info(), os de­sen­vol­ve­do­res obtêm ra­pi­da­mente insights sobre os dados e iden­ti­fi­cam cor­re­la­ções es­ta­tís­ti­cas.
  • Limpeza e pré-pro­ces­sa­mento de dados: é ne­ces­sá­rio limpar e organizar em um formato con­sis­tente os dados obtidos de diversas fontes antes de analisá-los. O Pandas oferece várias funções para filtrar e trans­for­mar esses dados.
  • Ma­ni­pu­la­ção e trans­for­ma­ção de dados: as prin­ci­pais tarefas do Pandas são ma­ni­pu­la­ção, análise e trans­for­ma­ção de conjuntos de dados. Funções como merge() ou groupby() pos­si­bi­li­tam realizar operações complexas en­vol­vendo os dados.
  • Vi­su­a­li­za­ção de dados: outro campo prático de aplicação é a com­bi­na­ção com outras bi­bli­o­te­cas, como Mat­plo­tlib ou Seaborn. Assim, o DataFrame do Pandas pode ser con­ver­tido di­re­ta­mente em diagramas ou plotagens.

Vantagens do Python Pandas

O Python Pandas oferece diversas vantagens que o tornam uma fer­ra­menta in­dis­pen­sá­vel para analistas de dados e pes­qui­sa­do­res. Sua API intuitiva e de fácil com­pre­en­são assegura um alto nível de usa­bi­li­dade. Como as es­tru­tu­ras de dados centrais do Python Pandas (DataFrame e Series) são parecidas com planilhas, não é muito difícil aprender a trabalhar com elas.

Outra vantagem fun­da­men­tal do Python Pandas é o seu de­sem­pe­nho. Embora o Python seja conhecido como uma linguagem de pro­gra­ma­ção lenta, o Pandas é capaz de processar grandes conjuntos de dados de forma eficiente. Isso acontece porque a bi­bli­o­teca foi escrita na linguagem C e utiliza al­go­rit­mos oti­mi­za­dos.

O Pandas oferece suporte a vários formatos de dados, incluindo CSV, Excel e bancos de dados SQL, pos­si­bi­li­tando im­por­ta­ções e ex­por­ta­ções fa­ci­li­ta­das de diversas fontes, au­men­tando ainda mais sua fle­xi­bi­li­dade. Sua in­te­gra­ção com outras bi­bli­o­te­cas do ecos­sis­tema Python, como NumPy e Mat­plo­tlib, amplia sua ver­sa­ti­li­dade e pos­si­bi­lita a re­a­li­za­ção de análises e mo­de­la­gens de dados abran­gen­tes.

Nota

Se você tem ex­pe­ri­ên­cia com outras lin­gua­gens de pro­gra­ma­ção, como R, ou com bancos de dados, como SQL, iden­ti­fi­cará muitos conceitos similares no Pandas.

Exemplos práticos da sintaxe do Python Pandas

Para ilus­trar­mos a sintaxe básica do Pandas, vamos analisar um exemplo simples. Imagine um conjunto de dados CSV com in­for­ma­ções sobre vendas. Car­re­ga­re­mos esse conjunto, o exa­mi­na­re­mos e re­a­li­za­re­mos uma ma­ni­pu­la­ção básica dos dados. O conjunto é es­tru­tu­rado da seguinte forma:

Data,Produto,Quantidade,Preço
2024-01-01,Produto A,10,20.00
2024-01-02,Produto B,5,30.00
2024-01-03,Produto C,7,25.00
2024-01-04,Produto A,3,20.00
2024-01-05,Produto B,6,30.00
2024-01-06,Produto C,2,25.00
2024-01-07,Produto A,8,20.00
2024-01-08,Produto B,4,30.00
2024-01-09,Produto C,10,25.00

Passo 1: Importar o Pandas para o Python e carregar o conjunto de dados

Após importar o Python Pandas, você poderá criar um DataFrame a partir dos dados em formato CSV com o uso da função read_csv().

import pandas as pd
# Carregar o registro de dados a partir do arquivo CSV chamado dados_vendas.csv
df = pd.read_csv('dados_vendas.csv')
python

Passo 2: Examinar conjunto de dados com o Python Pandas

Uma visão geral dos dados é obtida ao exibir as primeiras linhas e um resumo es­ta­tís­tico do conjunto. As funções head() e describe() são usadas para essa fi­na­li­dade. Em especial, describe() apresenta uma visão geral de índices es­ta­tís­ti­cos im­por­tan­tes, como o valor mínimo e o máximo, o desvio padrão e o valor médio.

# Exibir as primeiras cinco linhas do DataFrame
print(df.head())
# Exibir um resumo estatístico
print(df.describe())
python

Passo 3: Manipular dados com o Python Pandas

Também é possível manipular dados com o Python Pandas. No código a seguir, os dados de vendas foram agregados por produto e mês:

# Converter a coluna “Data” em um objeto de data e hora para que as datas sejam identificadas corretamente
df['Data'] = pd.to_datetime(df['Data'])
# Extrair o mês da coluna “Data” e salvá-lo em uma nova coluna chamada “Mês”
df['Mês'] = df['Data'].dt.month
# Calcular a receita (Quantidade x Preço) e salvá-la na coluna chamada “Receita”
df['Receita'] = df['Quantidade'] * df['Preço']
# Agregar os dados de vendas por produto e mês
sales_summary = df.groupby(['Produto', 'Mês'])['Receita'].sum().reset_index()
# Exibir os dados agregados
print(sales_summary)
python

Passo 4: Vi­su­a­li­zar dados

Por fim, você pode vi­su­a­li­zar os números de vendas mensais de um produto usando a bi­bli­o­teca Python Mat­plo­tlib.

import matplotlib.pyplot as plt
# Filtrar os dados para encontrar um produto específico
product_sales = sales_summary[sales_summary['Produto'] == 'Produto A']
# Criar um gráfico de linhas 
plt.plot(product_sales['Mês'], product_sales['Receita'], marker='o')
plt.xlabel('Mês')
plt.gca().set_xticks(product_sales['Mês'])
plt.ylabel('Receita')
plt.title('Receita mensal produto A')
plt.grid(True)
plt.show()
python

O gráfico abaixo indica que, no primeiro mês do ano, o produto A gerou R$ 940 de receita:

Imagem: Dados plotados do Python Pandas
Dados do Python Pandas podem ser plotados com fa­ci­li­dade quando com­bi­na­dos com outras bi­bli­o­te­cas
Ir para o menu principal