Big Data e a ciência de dados

Voltando às cinco profissões do futuro, segundo a Hotmart: outra área profissional com imenso potencial nos próximos anos será a de «especialista em Big Data». Normalizar e interpretar os enormes volumes de dados gerados pelos utilizadores da internet, e armazenados em servidores das empresas que fornecem os vários serviços, é um trabalho que traz grande retorno a essas mesmas empresas, permitindo encontrar padrões de consumo e perfis de utilizadores, o que torna possível prever, ou estimular, futuras interacções e consumos.

Todos nós que utilizamos as redes sociais e o motor de pesquisa do Google, se não temos controlos apertados de privacidade, verificamos com frequência que após a interacção com um determinado conteúdo, surge-nos em seguida, pouco tempo depois, um outro conteúdo relacionado. Por vezes esse conteúdo sugerido surge no mesmo canal de comunicação onde interagimos antes; noutras vezes, o que pode parecer-nos mais surpreendente, surge noutro canal de comunicação. Isto demonstra como não só uma determinada empresa utiliza os nossos dados para antever futuros comportamentos, como comercializa essas nossas interacções em bruto com «empresas parceiras», que por sua vez nos apresentam produtos ou serviços associados àqueles que procurámos inicialmente.

O Guia de Profissões para os Jovens conta com a participação de uma «Cientista de Dados». Raquel H. Ribeiro é hoje em dia professora universitária em Ciências Computacionais para a Minerva Schools at KGI, em São Francisco, nos Estados. Para além dos usos de Big Data referidos acima, há a referir, como escreve a Raquel H. Ribeiro, que a ciência de dados «pode ter um grande impacto social: os modelos matemáticos criados podem rapidamente responder a problemas concretos e melhorar a qualidade de vida das pessoas». A utilização, por exemplo, dessa análise de dados no contexto dos serviços de saúde é uma realidade cada vez mais presente, e com impacto fortíssimo na eficiência dos serviços e nos tratamentos efectivos às pessoas.

Importa salientar, nas palavras da Raquel H. Ribeiro, que «este trabalho requer conhecimentos técnicos de ciência e informática, e capacidade de realizar experiências estatísticas e de inteligência artificial. Também é essencial ter uma curiosidade insaciável e competências de comunicação para partilhar os resultados de investigações. […] Para além de ter conhecimentos sólidos do método científico e de linguagens de programação (tipicamente Python e R), um cientista de dados deve saber recorrer a métodos estatísticos para procurar padrões nos dados. Estas bases de conhecimento são normalmente encontradas em cursos de formação matemática (sobretudo Física, Matemática Pura e Matemática Aplicada), mas áreas como biomedicina também podem ser mais-valias.»