É uma ciência multidisciplinar que combina Know-how em Domínio da Matemática, Tecnologia, Skills de Hacking e Visão de Negócio.
A capacidade de visualizar dados provém de forma quantitativa, envolvendo correlações de dados que podem ser expressos matematicamente.
Nesta área, conhecimentos de estatística clássica e estatística Bayesiana são úteis, bem como conhecimentos de álgebra linear.
Tanto os grandes conjuntos de dados como os algoritmos matemáticos complexos requerem ferramentas muito mais sofisticadas do que o Excel.
Os Data Scientists precisam de ser capazes de codificar-prototipar soluções rápidas, bom como integrar sistemas de dados complexos. As principais linguagens associadas à ciência de dados incluem SQL, Python, R e SAS.
Trabalhando tão intimamente com os dados, os Data Scientists têm a responsabilidade de transpor as suas observações compartilhando e contribuindo para a estratégia da empresa e para a resposta aos principais problemas de negócio. Ter esta visão do negócio é tão importante quanto ter visão tecnológica e relacionada com os algoritmos.
É necessário have um alinhamento claro entre os projetos de Data Science e os objetivos do negócio. Em última análise, o valor não vem dos dados, matemática e tecnologia em si. É o resultado do aproveitamento de todas as áreas mencionadas para construir recursos valiosos de forma a ter uma forte influência nos negócios.
Cada vez mais pessoas usam computadores, tablets e smartphones, e todos estes geram muitas informações, levando a que 90% dos dados do mundo tenham sido criados apenas entre 2015 e 2018, não só pelas pessoas que fornecem dados, mas também pelos algoritmos e outros softwares que rastreiam o comportamento do utilizador e geram os seus próprios dados sobre ele.
Ou seja, a quantidade de dados produzidos é e será cada vez maior! Contudo, nem todos os dados constituem informações importantes para as empresas e para os seus negócios e é aqui que entra a Data Science, a Ciência dos Dados.
Está mais focado no negócio do que outras disciplinas de Data Science. Ou seja, Analytics é o processo de transformar informação em acções e resultados operacionalizáveis para as empresas.
Devido à dificuldade de filtrar a informação importante, muitas empresas preferem recolher toda a informação, para o caso de ser útil no futuro. O resultado disto é uma grande quantidade de informação - Big Data.
É um ramo de inteligência artificial baseado na ideia de que sistemas podem aprender com dados, identificar padrões e tomar decisões com o mínimo de intervenção humana.
É um tipo de Machine Learning que treina computadores para realizar tarefas como seres humanos, que inclui reconhecimentos da fala, identificação de imagem e previsões, através do processamento de dados.
Com exceção de empresas exclusivamente tecnológicas e algumas empresas já muito estruturadas e com grande dimensão, a "necessidade" de um data scientist, para uma grande parte das empresas, ainda não existe. Contudo, com a transformação tecnológica cada vez mais acentuada e com a vantagem competitiva dassas empresas face a outras, no que diz respeito a opções de negócio, esta necessidade irá surgir no mercado global cada vez mais.
Quando procurares uma profissão em Data Science, convém leres cuidadosamente a descrição da função de forma a encontrares empregos para os quais estás qualificado ou procurares desenvolver essas skills solicitadas, pois Data Science é frequentemente usado para descrever profissões que são drasticamente diferentes entre si.