Metodologias de extração, modelagem e análise de informações e dados foram alguns dos tópicos abordados no seminário do Centro de Estudos sobre Ciência de Dados Aplicada à Saúde, realizado na terça-feira, 18 de outubro, no Salão de Leitura da Biblioteca de Manguinhos. Além do lançamento da Plataforma de Computação Científica de Dados em Saúde (leia mais ao lado), o evento trouxe experiências práticas sobre as principais ferramentas e técnicas em uso atualmente nesse campo.
Os palestrantes apresentaram temas inerentes a ciência de dados, como big data, mineração de dados e aprendizagem de máquina. O assunto foi apresentado pelo cientista de dados Mário Filho, consultor em machine learning. “Não é nenhuma mágica, trata-se apenas novas de novas ferramentas”, apontou. Elas buscam desenvolver algoritmos e técnicas que permitam o computador aprender tendências, aperfeiçoando seu desempenho em determinadas tarefas.
O convidado explicou que para um projeto de ciência de dados ter sucesso é fundamental atender alguns critérios, como utilizar dados corretos e variáveis relevantes ao problema a que se busca solucionar, além de uma validação correta e modelos de dados confiáveis. No campo da saúde, Filho descreveu projetos que já aplicam ciência de dados em suas análises, como no Egito, onde se buscou a predição de locais com presença de mosquitos na bacia do Rio Nilo, para ações de prevenção.
Mário Filho é cientista de dados e competidor frequente da plataforma Keggle. Foto: Raquel Portugal - Multimeios/Fiocruz.
O responsável pela Tecnologia da Informação da plataforma científica SciElo, Fábio Batalha, apresentou como foi utilizada a metodologia Elasticsearch para a construção de indicadores de uso, publicação e impacto do repositório. Essas ferramentas possibilitaram a remodelagem da infraestrutura de indicadores, possibilitando o rastreamento de citações, a entrega de contextualizações desses dados e marcadores e compartilhamento. “Usamos diferentes módulos de metadados por diferentes algoritmos que podem ser disponibilizados ao público por meio de APIs (interfaces de programação)”, explicou. A ferramenta é pública e o código está disponível pelo GitHub.
Sobre as possibilidades do uso de machine learning em pesquisas de saúde no Brasil, a pesquisadora Hellen Geremias dos Santos, do Laboratório de Big Data e Análise Preditiva em Saúde da Universidade de São Paulo, enxerga bastante potencial. “Predição ainda é um assunto muito novo no campo da saúde”, avaliou. Uma das técnicas citadas foi a superlearner, descrita por Sheri Rose, que correlaciona sete variáveis preditoras e doze algoritmos de predição, aplicando diferentes métodos simultaneamente para uma mesma estimativa.
Outro uso de ciência de dados abordado foi o conjunto de ferramentas da IBM para análise de sentimento. Com ele, é possível avaliar tendências em redes sociais, por exemplo, como o estudo em andamento em parceria com a Fiocruz, que investigou a percepção da população sobre o vírus zika.
“Fizemos filtragens para separar conteúdos irrelevantes, como spam. Apesar disso 85% dos dados mostraram-se relevantes”, revelou Paulo Cavalin, pesquisador da IBM Research Brasil. De junho de 2015 a outubro de 2016, o estudo encontrou 190 mil impressões sobre o assunto. Márcia Ito, também do IBM Research, demonstrou o uso de dados na investigação do cuidado a pacientes com doenças crônicas.
Por fim, o representante da Dell EMC, Fred Arruda, apresentou algumas iniciativas da companhia realizadas em parceria com a Prefeitura do Rio de Janeiro, que utilizam big data. “No centro de operações da cidade trafega um volume de dados absurdo. Agora eles são tratados em tempo real”, explicou. A parceria inclui ações nas áreas de mobilidade urbana e de planejamento de megaeventos, como os últimos Jogos Olímpicos. As palestras foram seguidas de debate, sob mediação de Fábio Porto, do LNCC.
Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz)
Av. Brasil, 4.365 - Pavilhão Haity Moussatché - Manguinhos, Rio de Janeiro
CEP: 21040-900 | Tel.: (+55 21) 3865-3131 | Fax.: (+55 21) 2270-2668
Este site é regido pela Política de Acesso Aberto ao Conhecimento, que busca garantir à sociedade o acesso gratuito, público e aberto ao conteúdo integral de toda obra intelectual produzida pela Fiocruz.
O conteúdo deste portal pode ser utilizado para todos os fins não comerciais, respeitados e reservados os direitos morais dos autores.
Comentar