Análise dos dados de emissão de CO2 no planeta

Pandas Couple
8 min readDec 13, 2021

--

Cerca de 86% das emissões de dióxido de carbono do mundo vêm da queima de combustíveis fósseis para a produção de energia e materiais.

As primeiras eras da industrialização foram dominadas pela queima de carvão vegetal. Só no final do século 19 começam a aumentar as emissões por petróleo e gás natural. E, no final do século 20, as emissões pela produção de cimento e pela chama — um dispositivo de combustão de gases inflamáveis usado na indústria, se tornam mais significativas.

Cerca de 52,74% da emissão de CO2 em todo o mundo ocorreu a partir de 1990, ou seja, mais da metade das emissões ocorreram nos últimos 30 anos.

image: Freepik.com

A alta concentração de dióxido de carbono leva à poluição do ar, formação de chuva ácida e desequilíbrio do efeito estufa (com consequente elevação da temperatura da Terra), que traz consigo o derretimento de calotas de gelo e a elevação dos níveis oceânicos, resultando em uma grande degradação ambiental de ecossistemas e paisagens.

Por esse motivo, é que uma empresa ambiental nos procurou para realizar um estudo baseado em dados.

Vamos as perguntas solicitadas pela empresa:

  1. Quais são os países com maiores emissões per capita no ano mais recente;
  2. Dentre os países listados na pergunta (1), queremos os vinte países que possuem as maiores populações, junto ao seu respectivo PIB;
  3. Para os países listados na pergunta (2), queremos saber as mudanças ao longo do tempo em um intervalo de vinte anos;
  4. Além de analisar as maiores emissões per capita dos vinte países com as maiores populações, queremos saber as emissões anuais destes países no ano mais recente.

Resumindo: precisamos basicamente, selecionar os países com as maiores emissões per capita no último ano, desses países, selecionaremos os vinte que possuem as maiores populações, junto ao respectivo PIB (também baseado pelo último ano).

Queremos analisar as mudanças das emissões per capita dos últimos vinte anos (dos países selecionados acima), além das emissões anuais dos mesmos, mas essa, apenas no último ano.

1. Coleta dos dados

Os dados foram coletados do ourworldindata e do worldbank. Essas são fontes de dados confiáveis e utilizadas por diversas pessoas e empresas. As fontes são extremamente importantes para que se obtenha um trabalho legítimo.

2. Análise Exploratória

Vamos utilizar as perguntas oriundas do negócio para fazer essa análise e consequentemente respondê-las. Dessa forma geramos valor, melhoramos a tomada de decisão por parte da companhia e possivelmente ajudaremos a incrementar os lucros.

2.1. Preparação do conjunto de dados

Nesta primeira etapa da análise exploratória, vamos analisar nossos conjuntos de dados de maneira visual e prepará-los para respondermos as perguntas necessárias ao negócio.

Como essa é uma etapa onde praticamente iremos fazer a união das quatro tabelas coletadas, não vou mostrar aqui nesse artigo. Caso você queira ver como foi feita essa união, acesse esse notebook pelo meu github.

Esse é o resultado da união das quatro tabelas:

Finalmente chegamos a um dataframe final. Vamos utilizá-lo para responder as perguntas solicitadas pela empresa. Obviamente, ele acabou gerando alguns valores nulos, visto que tínhamos alguns dados presentes em um dataframe e no outro não, isso não será um problema, já que estamos fazendo apenas uma análise exploratória.

Caso fossemos fazer algum algoritmo de machine learning por exemplo, esses valores nulos teriam que ser tratados, pois, os modelos não aceitam entradas nulas em suas matrizes de alimentação.

2.2. Análise das perguntas solicitadas pela empresa

Recapitulando, as perguntas solicitadas pela empresa foram:

  1. Quais são os países com maiores emissões per capita no ano mais recente;
  2. Dentre os países listados na pergunta (1), queremos os vinte países que possuem as maiores populações, junto ao seu respectivo PIB;
  3. Para os países listados na pergunta (2), queremos saber as mudanças ao longo do tempo em um intervalo de vinte anos;
  4. Além de analisar as maiores emissões per capita dos vinte países com as maiores populações, queremos saber as emissões anuais destes países no ano mais recente.

Vamos respondendo uma a uma até termos uma análise completa e com várias informações valiosas. No final, teremos um conjunto de dados filtrado especificamente para essa análise e isso vai nos ajudar a montar uma apresentação gráfica muito interessante para apresentar aos executivos da empresa. Vamos lá!

Quais são os países com maiores emissões per capita no ano mais recente:

Legal! Agora vamos filtrar o nosso conjunto de dados apenas para o ano de 2020.

Com o conjunto de dados filtrado, é hora de saber quais são os países com as maiores emissões de CO2 per capita, e com isso respondemos a primeira pergunta.

Para fazer isso, vamos fazer uma lista com os países e as emissões per capita e organizá-la em ordem decrescente, assim teremos a nossa resposta.

Primeira pergunta respondida! Temos a nossa lista em ordem decrescente dos países que mais emitiram CO2 per capita em 2020. A lista está cortada por conveniência visual da análise (para não ficar muito poluído), mas qualquer pessoa pode acessar e ver quantos países quiser.

Vamos a nossa segunda pergunta.

Dentre os países listados na pergunta (1), queremos os vinte países que possuem as maiores populações, junto ao seu respectivo PIB:

Segunda pergunta, também respondida! Segue a lista dos 20 países mais populosos e que mais emitem CO2 per capita ao mesmo tempo.

Vamos a terceira pergunta.

Para os países listados na pergunta (2), queremos saber as mudanças ao longo do tempo em um intervalo de vinte anos:

Com essa tabela, temos a nossa terceira pergunta respondida. Nesse caso, é muito interessante ver esses dados graficamente, pois, eles são uma série temporal e é muito conveniente ver esse tipo de dado em gráficos de linha.

Vamos analisar apenas um país por vez, dessa forma o gráfico não ficará confuso e as informações não irão se sobrepor.

Veja só que interessante, o Qatar é um dos países que mais emite CO2 per capita do mundo e essa emissão já foi muito maior, eles estão em uma curva descendente o que é bom para o planeta, porém ainda tem muito o que melhorar.

Podemos fazer gráficos com todos os países da lista, plotei com o Qatar para exemplificar. Fica a critério do analista ou usuário.

Finalmente, vamos a última pergunta.

Além de analisar as maiores emissões per capita dos vinte países com as maiores populações, queremos saber as emissões anuais destes países no ano mais recente.

Já temos a resposta dessa pergunta, pois, fizemos uma tabela na pergunta (2) que mostra essa resposta. Vamos verificar a tabela novamente.

Essa tabela já nos diz as emissões anuais dos vinte países que estamos analisando. Podemos fazer gráficos de linha para esse dado também (emissões anuais), pois, ele também é uma série temporal, vamos verificar?

Vejam só que contradição interessante. As emissões per capita estão diminuindo e as emissões anuais estão aumentando, isso mostra que a população do Qatar vem crescendo bastante, diluindo as emissões per capita, porém o país está emitindo em sua totalidade, cada vez mais CO2 na atmosfera.

Vamos analisar a curva da população também para confirmar essa informação.

Nossas suposições estavam corretas. Se os dados não tivessem sido mostrados de forma gráfica, talvez essa informação teria passado despercebida e estaríamos achando que o Qatar está melhorando suas emissões de CO2, quando na verdade, está piorando drasticamente.

Nesse caso, com todas as perguntas respondidas, chegou a hora de criar uma visualização final para os solicitantes das perguntas, tentando deixar todas as informações o mais claro possível para que não seja cometido esse tipo de engano. Isso é muito importante para que uma tomada de decisão seja feita da forma mais assertiva possível. Veja como temos uma grande responsabilidade, qualquer erro ou omissão de informação pode levar a decisões extremamente equivocadas.

image: Freepik.com

Por fim, vamos exportar as nossas tabelas que possuem as respostas das perguntas do negócio para que possamos trabalhar nossa visualização e entrega do projeto no próximo tópico.

3. Visualização final — entrega do projeto

Agora, é interessante documentar tudo e elaborar apresentações legais com visualizações claras.

Normalmente, trabalhamos nessa etapa depois de ter estudado e explorado os dados. Já temos em mente a estrutura do conteúdo, isso nos ajuda a encontrar as inspirações e os elementos visuais nas quais podemos trabalhar. Isso será muito útil para a visualização final.

Neste caso, pensando em nossos dados, precisamos de uma visualização capaz de transmitir uma informação temporal e temos que replicá-la para os vinte países em questão. Vamos trabalhar nessa visualização!

Esse relatório foi montado por meio do PowerBI, uma ferramenta muito poderosa de visualização de dados que será compartilhada de forma dinâmica com os interessados na análise.

Veja que, tentei deixar o relatório o mais claro possível, de forma que todas as perguntas solicitadas pela empresa pudessem ser respondidas apenas interagindo com esse dashboard. Essa etapa é fundamental, pois, é o que as pessoas irão ver, ela precisa estar muito clara para não gerar dúvidas e enganos.

Conclusão

Uma análise exploratória, geralmente é necessário em qualquer análise, mesmo que o objetivo final não seja simplesmente responder a algumas perguntas de negócio como foi aqui.

Costumamos sempre passar por uma parte mais exploratória/descritiva em qualquer projeto de ciência de dados ou análise de dados, é essa exploração que vai te permitir conhecer os seus dados para que seja possível chegar no objetivo final de forma mais assertiva.

Nesse projeto passamos pelas seguintes etapas:

  • Entender as perguntas do negócio;
  • Coleta dos dados;
  • Análise exploratória:
  1. Preparação do conjunto de dados;
  2. Análise das perguntas solicitadas pela empresa.
  • Visualização final e entrega do projeto.

Obrigado por acompanhar até aqui!

--

--

Pandas Couple
Pandas Couple

Written by Pandas Couple

Casal de Cientistas de Dados, contribuindo para a comunidade de Data Science.

No responses yet