Existem muitas carreiras diferentes na área de data science, e os novatos podem acabar se confundindo facilmente com relação ao papel desempenhado por cada uma. 

Para iniciar uma carreira em ciência de dados, você deve achar uma opção viável e que melhor encaixe as suas competências e personalidade.

Um mal entendimento sobre as funções de uma carreira podem, portanto, afetar o seu leque de possibilidades, e você pode acabar perdendo uma ótima oportunidade. 

Vamos olhar os principais tipos de carreiras em ciência de dados, o que elas exercem, e as qualificações necessárias para ter êxito no mercado de data science. 

Arquiteto de Dados 

O Arquiteto de Dados exerce um trabalho mais focado em engenharia da infraestrutura dos armazéns de dados, bem como no manejo dos dados neles contidos.

Pouca análise de dados é feita nessa profissão – somente análise do armazenamento de dados para melhorar a performance do mesmo – e uso de linguagens como Python e R não serão estritamente necessárias. 

É necessário, entretanto, ter uma expertise em bases de dados relacionais e não-relacionais. A seleção de armazéns para diferentes tipos de dados, a habilidade de transformação e carregamento dos dados também serão necessárias. O Arquiteto de Dados deve saber operar com bases de dados, armazéns de dados, e lagos de dados. 

SQL, Jaql, Hive, Pig, entre outras linguagens de data query serão fundamentais para essa carreira, sendo uma das ferramentas principais para realização do trabalho cotidiano do Arquiteto. Você deve ter a capacidade de verificar a consistência dos dados, e otimizar o acesso deles. 

Em anúncios, é provável que esse cargo esteja exibido como:

  • Administrador de base de dados
  • Administrador de Spark
  • Administrador de Big Data
  • Engenheiro de base de dados
  • Gerente de dados

Engenheiro de Dados

O engenheiro de dados possui um enfoque maior em engenharia e manejo da infraestrutura que apoia os dados e as pipelines.

A infraestrutura de dados é uma coleção de soluções de software e armazenamento que permitem a recuperação dos dados da data store, o processamento dos dados de maneiras específicas, e a movimentação dos dados entre tarefas. 

Pense na infraestrutura como um caminho que os dados fazem conforme passam da sua “casa” até o local onde serão utilizados. O engenheiro de dados deve ter um excelente conhecimento de DataOps e sua integração no ciclo de vida dos dados. 

O engenheiro de dados elabora e implementa a infraestrutura de dados. Pensemos assim: o engenheiro de dados cria o modelo do carro e produz ele, enquanto o arquiteto de dados é o mecânico – que possui a tarefa de manter o carro em pleno funcionamento. 

As habilidades necessárias para esses dois trabalhos são parecidas, mas requerem níveis de expertise diferentes. Enquanto um arquiteto de dados deve ter um conhecimento apenas basilar de alguns conceitos (como o processo de transformação que a organização precisa implementar nos seus dados antes da modelagem dos mesmos), o engenheiro deve ter um conhecimento muito mais avançado dos mesmos conceitos (e vice-versa) 

Você pode perceber que, muitas vezes, uma oferta de trabalho para engenheiro de dados pode ser encontrada como:

  • Engenheiro de Big Data
  • Engenheiro de Infraestrutura de Dados 

Analista de Dados

O analista de dados, como o nome indica, foca na análise e na apresentação dos dados. Esse trabalho está relacionado à análise estatística descritiva dos dados, que inclui: preparo do relatório; dashboards; KPIs; e métricas de performance do negócio. Também engloba tudo aquilo que chamamos de “business intelligence”. 

Geralmente, o trabalho requer um conhecimento de bases de dados relacional e não relacional, bem como outros frameworks de dados.

Aqui, o profissional deve trabalhar com diversos skills diferentes, como: SQL; bases de dados relacionais; bases de dados NoSQL; armazenamento de dados; relatórios comerciais e de código aberto; e pacotes de painéis de controle. 

Alguns trabalhos relacionados à análise de dados são:

  • Analista de Business
  • Analista de BI 

Engenheiro de Machine Learning

O engenheiro de Machine Learning desenvolve e otimiza os algoritmos, implementando e manejando os modelos de machine learning em nível de produção. Utilizam ferramentas de predição e correlação para alavancar os dados. 

Nesta posição, o engenheiro deve sempre questionar os dados, utilizando seu conhecimento de estatística para saber quando as respostas provenientes do trabalho não são suficientemente confiáveis. 

Estatística e programação são habilidades essenciais para esse cargo. Matemática (especialmente álgebra linear e cálculo intermediário) também são competências úteis para aqueles que buscam implementar algoritmos mais complexos e avançados (como redes neurais ou computer vision).

O entendimento da teoria de aprendizado de máquinas também se mostra indispensável. 

Quando um modelo de machine learning se mostrar suficientemente bom para produção, pode ser pedido ao engenheiro que leve o modelo para produção. Neste caso, você terá que ter conhecimento de MLOps. 

Trabalhos relacionados à engenharia de machine learning são:

  • Cientista de Machine Learning
  • Profissional de Machine Learning
  • Qualquer engenheiro de um tipo específico de machine learning, como: Engenheiro de Computer Vision 
  1. Cientista de Dados

A preocupação central do cientista de dados são os insights que podem ser extraídos dos dados, e a história que eles podem criar. Ele pode utilizar qualquer uma das tecnologias disponíveis, dependendo do seu cargo.

É o famoso “faz tudo” da ciência de dados, possuindo um leque amplo de habilidades que permitem a extração de informações valiosas dos dados obtidos. 

O conhecimento de domínio é essencial para essa profissão, bem como uma excelente compreensão de estatística, linguagens de programação, visualização de dados, e habilidades de comunicação. 

O resumo:

O arquiteto e engenheiro de dados estão primariamente preocupados com a infraestrutura que armazena e transporta os dados. O analista foca em descrever os dados, trazendo fatos sobre aquilo que existe. 

O engenheiro de machine learning, por sua vez, busca aplicar as ferramentas necessárias para alavancar os dados, visando extrair de suas capacidades preditivas e correlacionais. 

Por fim, o cientista de dados se preocupa com os dados, os insights provenientes dos mesmos, e as histórias que podem ser elaboradas por meio da utilização deles. 

Published On: junho 21st, 2021 / Categories: Carreiras, Data Science / Tags: , , /

Aprenda a conseguir trabalho

Se inscreva para receber acesso gratuito ao módulo Conseguindo Trabalho!

Obrigado por se inscrever!
Houve um erro ao enviar sua inscrição. Tente novamente mais tarde.

Ao acessar, você concorda em receber nossos comunicados.