">
Quando se pensa em dados de saúde, de imediato vêm a imagem de bases de dados disponíveis no DATASUS. Contudo, numa sociedade digital em que, de acordo com a IBM, em 2013 cerca de 2,5 quintilhões de dados são gerados pelos usuários da internet todos os dias, torna-se uma necessidade estratégica de saúde pública usar essas informações na formulação, monitoramento e avaliação de ações e políticas.
O pesquisador em Saúde Pública do Laboratório de Informação em Saúde (Lis/Icict), Marcel Pedroso, coordenador da Plataforma de Computação Científica e Big Data em Saúde do Icict, explica que mais que grande quantidade de dados, a estratégia da computação científica e Data Science, consiste na aquisição, armazenamento, análise e visualização de dados de fontes e formatos diferentes e diversos.
“Uma estratégia verdadeira de Big Data precisa ter não só um grande volume de dados, mas uma variedade de dados. Uma plataforma que lide bem com esses dados e dados estruturados, disponíveis em bases de dados do DATASUS, Instituto Brasileiro de Geografia e Estatística (IBGE) e Instituto de Pesquisa Econômica Aplicada (Ipea), por exemplo, semiestruturados (fotos e vídeos) e não estruturados (postagens em redes sociais, comentários, hashtags)”.
No Brasil, existem diversas bases de dados estruturados e conhecidos dos pesquisadores de Saúde Pública. Uma parceria firmada entre o Lis e o LNCC (Laboratório Nacional de Computação Científica), sediado em Petrópolis, por exemplo, está desenvolvendo a Plataforma de Computação Científica e Big Data em Saúde usando infraestrutura de computação distribuída (cluster Hadoop) e ferramentas de governança de dados, tais como o Data Management Body of Knowledge. Para promover a utilização da plataforma, essa iniciativa tem como objetivo coletar, transformar, carregar e disponibilizar diferentes bases de dados de interesse numa mesma interface, visando fornecer acesso qualificado e ferramentas para análise desses dados aos pesquisadores de Instituições de Ensino e Pesquisa, bem como, gestores governamentais.
A Plataforma de Computação Científica e Big Data em Saúde tem como objetivo utilizar esse volume e variedade de dados que são produzidos para análises preditivas que possam servir para identificar padrões de comportamento no surgimento de doenças, usando a mineração de dados. “O que a gente quer aqui é deixar esses dados disponíveis em tempo oportuno para qualquer pesquisador cadastrado na plataforma”, conta o professor. “Atualmente quem mais utiliza o Data Science em saúde é a parte de biologia genética, no seqüenciamento. Mas o pessoal de Saúde Ambiental pode usar muito usando dados do ambiente com dados de saúde para identificar padrões”.
Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict/Fiocruz)
Av. Brasil, 4.365 - Pavilhão Haity Moussatché - Manguinhos, Rio de Janeiro
CEP: 21040-900 | Tel.: (+55 21) 3865-3131 | Fax.: (+55 21) 2270-2668
Este site é regido pela Política de Acesso Aberto ao Conhecimento, que busca garantir à sociedade o acesso gratuito, público e aberto ao conteúdo integral de toda obra intelectual produzida pela Fiocruz.
O conteúdo deste portal pode ser utilizado para todos os fins não comerciais, respeitados e reservados os direitos morais dos autores.