A ciência de dados está se tornando um campo cada vez mais agitado a cada dia. Com todos os campos de treinamento e aulas online hoje em dia, quase todos podem se sentir como especialistas em dados em uma questão de meses.

Já conhece a ciência de dados comportamental? Confira o nosso artigo aqui! 

Entretanto, ser um data partner verdadeiramente útil, agradável e confiável requer muito mais do que apenas familiaridade com SQL e Python, ou conhecimento básico de estatística.

Existem diferenças notáveis entre os novatos de data science e aqueles que realmente entendem como lidar com dados. 

Leia sobre algumas transições comuns para carreiras em ciência de dados (e como realizá-las)

Esses comportamentos de novato podem diminuir a sua credibilidade e fazer com que os seus colaboradores questionem seu entendimento do assunto.

1) Interpretar demais os resultados e inventar histórias sem fundamento

Quando se trata de analisar tendências e gerar insights, o tamanho da amostra é sempre a primeira coisa a ser considerada.

A menos que seja um grupo de foco com pessoas representativas da sua base de clientes, 30 pontos de dados geralmente não lhe darão nenhuma visão robusta e aplicável.

Apresentar teorias sobre o motivo pelo qual as supostas tendências estão acontecendo também faz com que você perca credibilidade.

Em vez de pular em análises de tendências quando a amostra é pequena, concentre-se em criar estruturas para coletar mais dados com melhor qualidade para permitir essas análises no futuro.

Confira 7 itens essenciais para o seu currículo em ciência de dados! 

Se você realmente quer ter algumas ideias a partir de uma amostra pequena, faça uma advertência com a falta de quantidade de amostra e acrescente um intervalo de confiança às métricas que você relatar. 

2) Deixar de verificar a qualidade dos dados/vistorias antes de utilizá-los

Não há conjunto de dados perfeitos por aí. Portanto, como um especialista em dados, você deve saber melhor do que confiar na qualidade dos dados ao valor nominal.

Todos os dados que você consulta e analisa precisam ser verificados com qualidade: certifique-se de que as tabelas estão atualmente dedicadas corretamente, verifique se os carimbos temporais estão no fuso horário certo, e etc.

Não realizar CQ nos dados antes de usá-los pode causar resultados não intencionais e percepções enganosas, fazendo com que as pessoas duvidem da sua capacidade de lidar com dados complicados. 

3) Utilizar engenharia excessivamente

Quando se tem um martelo, especialmente um martelo brilhante e novinho, tudo parece um prego. 

Na realidade, a menos que você seja um engenheiro ML, raramente precisará de redes neurais de 10 camadas em seu trabalho diário de dados.

Confira as 6 habilidades que todo arquiteto de dados precisa ter

O uso de modelos “chiques” de ML – quando uma simples regressão linear resolveria o problema – não é apenas ineficiente, mas também contraproducente. 

Modelos e análises de engenharia em excesso são uma maneira certeira de se tornar o cientista impopular e ineficaz, com o qual as pessoas querem evitar trabalhar. 

 

Published On: outubro 22nd, 2021 / Categories: Análise de Dados, Data Science /

Aprenda a conseguir trabalho

Se inscreva para receber acesso gratuito ao módulo Conseguindo Trabalho!

Obrigado por se inscrever!
Houve um erro ao enviar sua inscrição. Tente novamente mais tarde.

Ao acessar, você concorda em receber nossos comunicados.