Verbete Draft: o que é Data Science

- 11 de maio de 2016
Conheça a Ciência de Dados e saiba porque o profissional que é "meio analista, meio artista" será crucial no mercado.
Conheça a Ciência de Dados e saiba porque o profissional que é "meio analista, meio artista" será crucial no mercado.

Continuamos a série que explica as principais palavras do vocabulário dos empreendedores da nova economia. São termos e expressões que você precisa saber: seja para conhecer as novas ferramentas que vão impulsionar seus negócios ou para te ajudar a falar a mesma língua de mentores e investidores. O verbete de hoje é…

DATA SCIENCE

O que acham que é: O mesmo que Análise de Dados.

O que realmente é: De forma simples, segundo Fábio Roberto Miranda, professor da Engenharia da Computação do Insper, Data Science (ou a Ciência de Dados) é “a fusão de estatística, computação e informática com enfoque em tomada de decisão a partir de muitos dados vindos de diversas fontes”. Já a NYU (Universidade de Nova York) diz que Data Science é um passo evolutivo em campos interdisciplinares como estatística, análise, matemática, modelagem e análise de negócios que incorporam a ciência da computação. Mais detalhadamente, diz que a essência da Data Science é usar métodos automatizados para analisar enormes quantidades de dados, a partir dos quais extrai conhecimento. Na indústria, causará transformações em áreas que vão da saúde à comunicação.

Um artigo publicado na Harvard Business Review, escrito por Thomas H. Davenpor, acadêmico especializado em análises, business, processos de inovação e gerenciamento de conhecimento, e DJ Patil, Data Scientist Chief do Departamento de Ciência e Tecnologia da Casa Branca, chama o cargo de cientista de dados de o mais sexy do século 21 (Data Scientist: The Sexiest Job of the 21st Century). Em suma, o texto diz que a chave para o uso efetivo da Big Data são os profissionais analíticos conhecidos como “data scientists” (aspas do original) que podem tanto manipular grandes e desestruturadas fontes de dados como criar insights a partir deles. Diz também que esses profissionais são difíceis de ser contratados e mantidos mas que suas habilidades serão necessárias para quaisquer organizações que desejem lucrar por meio da Big Data.

Em termos práticos, os filmes que o Netflix e os livros que a Amazon sugerem especificamente para cada um de seus usuários podem ser colocados na conta da Data Science, assim como a indicação de possíveis amigos e os anúncios (relacionados a buscas no Google) que aparecem no Facebook e o “People You May Know” do LinkedIn. É, por sinal, com um exemplo de lá o texto da HBR começa. Em 2006, o LinkedIn tinha 8 milhões de contas que não conversavam entre si. Com a chegada de Jonathan Goldman, PhD em Física de Stanford, é que começou a haver conexões entre os usuários. Vale ressaltar que as ideias de Goldman pareceram desinteressantes para o time de engenharia do site. Mas Reid Hoffman, cofundador e CEO do LinkedIn na época (hoje, Executive Chairman), em função de sua experiência prévia no PayPal, deu autonomia a Goldman e a plataforma, então, decolou.

Quem inventou: De acordo com Magali Andreia Rossi, professora do curso de Sistemas para Internet da Fatec (Faculdade de Tecnologia do Estado) de Carapicuíba, o termo tomou força após uma publicação de William S. Cleveland, professor da Purdue University. “Mas já havia sido mencionado anteriormente, nas décadas de 1960 e 1970, como possibilidade de uma nova designação que pudesse substituir a Ciência da Computação e, posteriormente, o Processamento de Dados em massa”, afirma ela.

Quando foi inventado: A publicação de Cleveland foi feita em 2001. Desde então, ainda segundo Rossi, a Data Science foi amplamente divulgada como um novo campo de estudos da Ciência da Computação e também utilizado para definir um novo profissional, o Data Scientist. “Atualmente, a popularização do termo deu-se com a nova forma de aquisição de dados de diversas fontes conhecida pelo conceito de uso da tecnologia Big Data”.

Para que serve: Para influenciar como uma organização vai abordar desafios, priorizar quais problemas resolver, detectar tendências, descobrir visões menos óbvias e, então, fornecer vantagens competitivas, desencadear mudanças, gerar lucro. Isso porque os Data Scientists, também descritos como “parte analistas, parte artistas”, exploram, fazem perguntas, questionam processos e teorias já tomadas como certas e, tudo isso, armados de dados e resultados analíticos. “Os dados têm um significado maior do que uma simples informação segregada e sua imensa quantidade oferece, desde que bem utilizados, um panorama para tomada de decisões mais eficientes”, diz Rossi.

Quem usa: As mais diversas áreas. Miranda diz que de grandes organizações a entidades governamentais. “Setores que se destacam são o online, o financeiro, o mercado imobiliário e o marketing”. É fácil pensar em gigantes da internet como Facebook, Netflix, LinkedIn, Amazon e Google porque seus modelos de negócios estão intrinsecamente ligados à Data Science mas o ambiente de atuação inclui áreas menos óbvias. O site Master’s in Data Science lista 14 áreas (dentre as quais biotecnologia, energia, finanças, governo, saúde, transportes e seguros) e dá uma visão geral de cada uma delas, com exemplos.

Efeitos colaterais: Possível invasão de privacidade e interpretação errônea de dados. “O que vem sido amplamente discutido em relação à Data Science é a questão da privacidade das pessoas, já que muitas empresas capturam dados privados de seus clientes ou os extraem via web. Mas, até agora, isso não está sendo tratado como efeito colateral mas, sim, como um ponto de atenção para quem extrai os dados”, diz Rossi. Miranda aponta não haver efeitos colaterais diretos com que se preocupar: “Um risco é a interpretação incorreta dos resultados dos algoritmos e, consequentemente, a tomada de decisões erradas”.

Quem é contra: “Usuários finais, preocupados com sua privacidade, têm sido contra o uso da Data Science por parte de empresas de varejo e redes sociais já que seus dados são usados para a exibição de anúncios direcionados ou mesmo para alterar o preço de um produto conforme seu perfil”, diz Miranda.

Para saber mais:
1) Leia, no New York Times, Data Science: The Numbers of Our Lives, texto que começa retomando a expressão “sexy” para designar o cargo de Data Scientist, explica a importância da área e seu crescimento, listando várias instituições de ensino que têm a matéria na grade curricular.
2) Navegue no link Top 10 TED Talks for the Data Scientists, do site KD Nuggets.
3) Leia, na seção de tecnologia da Forbes, A Very Short History Of Data Science, um histórico, sobre o tema, que vai de 1982 a 2009.
4) Leia, na Co.Exist, These Data Science Mercenaries Will Make The World A Better Place, sobre como os participantes do programa Data Science for Social Good (assista ao vídeo embedado na página) e estão alavancando dados para fazer a diferença em comunidades locais.

Veja também:

“É ridículo como as ‘modas’ digitais se tornam um paraíso para oportunistas no Brasil. Eis a verdade sobre elas”

- 9 de junho de 2017
Luciano Palma trabalha com tecnologia há mais de 20 anos e desvenda alguns "truques" usados por gente mais interessada em vender do que em entender sobre o que vende.

Verbete Draft: o que é Machine Learning

- 2 de novembro de 2016
Benedict Cumberbatch vive Alan Turing no filme 'The Imitation Game’, sobre o cientista da computação que perguntava se as máquinas eram capazes de pensar (foto: reprodução internet)

Agência de propaganda – Qual o futuro desse negócio? (aula de Pyr Marcondes na Academia Draft!)

- 3 de outubro de 2016
1179 5 0
No próximo dia 17, Pyr Marcondes, da ProXXIma, vem à Academia Draft falar sobre o futuro das agências de propaganda como negócio. Pra onde isso vai? Vem saber. Inscreva-se!