Metodologia

Home O Projeto Metodologia

Metodologia do VigiVac

A metodologia do Projeto Vigivac passa por quatro etapas centrais, e usufrui de três bancos de dados diferentes, disponíveis no site do Departamento de Informática do SUS — plataforma DataSUS, do Ministério da Saúde. O primeiro estágio das pesquisas é o processamento destes bancos como descrito abaixo.

As análises do projeto foram realizadas com informações individuais anônimas dos três bancos de dados disponíveis na plataforma do DataSUS:

  • Campanha Nacional de Vacinação contra Covid-19;
  • Notificações de Síndromes Gripais (SG; e-SUS Notifica);
  • Notificações de Síndrome Respiratória Aguda Grave (SRAG; SIVEP-Gripe).

Para este projeto, estes bancos são disponibilizados à Fiocruz com as mesmas variáveis da base pública, com a inclusão de uma chave criptografada que indica quando mais de uma notificação é referente à mesma pessoa. 

Atendendo à Lei Geral de Proteção de Dados (LGPD), essa chave criptografada impossibilita o acesso e manipulação das informações pessoais de identificação dos indivíduos, o que permite a anonimização dos mesmo, como: nome completo, nome da mãe ou pai, número de documentos como Cartão SUS, CPF, ou identidade, endereço, telefone. 

Para a coleta dos dados da pesquisa é necessária a anuência do Diretor do DataSUS e gestor das bases de dados de disseminação do Ministério da Saúde, conforme o regimento interno (Decreto nº 9.795, de 17 de maio de 2019).      

O trabalho da equipe VigiVac consiste na análise dos dados anonimizados. Portanto, riscos relativos à manipulação dos dados, como exposição ou uso inadequado de dados sensíveis existem em todos os estudos envolvendo seres humanos. Eles são minimizados neste projeto uma vez que os participantes são anônimos. 

Adicionalmente, o tratamento dos dados acontece em ambiente computacional seguro da Fiocruz, monitorado por políticas de proteção. Quanto à divulgação dos resultados, cuidados adicionais de segmentação da informação são tomados para aumentar a segurança, como o uso de agregação de dados por faixas temporais e regiões espaciais. Dessa forma, os dados agregados impossibilitam a identificação dos cidadãos participantes.

O diagrama abaixo mostra a estratégia de ligação de registros para produzir um banco de dados, possibilitando a análise da efetividade vacinal por indivíduo.  O pré-processamento e linkage dos dados é realizado no Datacenter da Fiocruz no Rio de Janeiro, em ambiente seguro monitorado e acessível apenas sob Rede Virtual Privada (VPN), utilizando Jupyter Labs e Apache Spark. A linguagem utilizada é a Python com as bibliotecas PANDAS e PySpark.

Linkage dos bancos: são coletados os registros de até quatro doses de um mesmo indivíduo. Em alguns casos pode ser coletado o registro de uma dose adicional. Todas as notificações de SG e SRAG de um mesmo indivíduo são coletadas.

Após o tratamento destes bancos, os pesquisadores do Projeto VigiVac estão aptos para explorar estas bases e, assim, gerar informações essenciais para auxiliar gestores na tomada de decisões, além de produzir conhecimento científico de importância para a saúde pública utilizando dados reais.


Análise de efetividade de vacinas

A investigação da efetividade das vacinas apresenta uma metodologia específica para cada análise que pode ser encontrada detalhada nos artigos científicos publicados pelo grupo de pesquisadores do Projeto VigiVac. Sinteticamente, os registros selecionados que atendem aos critérios mínimos de qualidade da informação estão descritos abaixo. 

A infecção sintomática é considerada quando um exame de antígeno ou RT-PCR positivo é documentado no SIVEP-Gripe ou no e-SUS Notifica para uma pessoa que relatou sintomas na data do registro. A internação hospitalar é considerada quando a data de internação é registrada no SIVEP-Gripe. O óbito é considerado quando registrado no SIVEP-Gripe ou no e-SUS Notifica, independentemente do participante ter sido internado ou não. 

A etapa de análise é realizada no Datacenter da Fiocruz e em nuvem, uma plataforma de computação de alto desempenho (HPC) contratada pela Microsoft Azure. O mesmo ambiente de Data Science foi gerado nos dois servidores, utilizando a estratégia de conteinerização, garantindo a compatibilidade dos scripts executados independentemente da infraestrutura. O cálculo da efetividade vacinal é realizado utilizando regressão binomial negativa e os Planos de Análise e Códigos-Fonte podem ser encontrados aqui.

Análise do atraso na vacinação

A análise no atraso da segunda dose considerou elegíveis os indivíduos que tomaram a primeira dose e que ainda não tomaram a segunda dose. No atraso da dose de reforço foram considerados elegíveis os indivíduos que tomaram a primeira e segunda dose e não tomaram a dose de reforço de uma das vacinas para Covid-19. 

Para o atraso na segunda dose foi estabelecida a data limite como o intervalo entre a primeira e segunda dose e 15 dias de tolerância. Para atrasos na dose de reforço a data limite foi definida como o intervalo entre a segunda dose e dose de reforço e 30 dias (um mês) de tolerância. Dessa forma, considera-se  o indivíduo em situação de atraso vacinal se a data limite for menor ou igual que a data de atualização do banco de dados, como mostra o infográfico abaixo. 

Os critérios relacionados ao atraso na vacinação desenvolvidos pelo Projeto VigiVac foram estabelecidos considerando que os imunizantes possuem tecnologias e esquemas de aplicação diferentes. Portanto, o atraso foi calculado com base nos intervalos entre doses específicos de cada vacina. 

Para a CoronaVac, o intervalo entre a primeira e segunda doses é de 28 dias. Para AstraZeneca e Pfizer foram considerados 84 dias de intervalo até 7 de outubro de 2021. Com a atualização do Plano Nacional de Operacionalização da Vacinação contra a Covid-19 (PNO) pelo Ministério da Saúde, a partir de 8 de outubro de 2021, para estes dois imunizantes, o intervalo passou para 56 dias (dois meses). 

Os indivíduos que tomaram a vacina da Janssen estão aptos para receber a dose de reforço (segunda dose) do imunizante, a partir do dia 23 de novembro de 2021, conforme divulgado em nota técnica pelo Ministério da Saúde. Dessa forma, para esse imunizante, foi considerado o intervalo de 56 dias (dois meses). Para estimar o atraso na dose de reforço foram considerados o intervalo de 120 dias (quatro meses) entre a segunda dose e a dose de reforço.

Linha do tempo: Intervalos entre doses de cada imunizante.

Critérios: 

  • Foi considerado o município de residência informado quando o indivíduo tomou a primeira dose ou segunda dose;
  • Foram removidos da análise indivíduos cujos registros de UF e/ou municípios estavam ausentes;
    Consideramos os indivíduos cujo atraso ocorre em um período de até 400 dias para segunda dose e 250 dias para a dose de reforço;
  • Consideramos os indivíduos cuja data de primeira dose ou segunda dose ocorreu no ano de 2021 e 2022;
  • Foram removidos da análise os registros “pendentes identificação”;
  • Foram removidos da análise os indivíduos com mais de um registro de na mesma dose;
  • Foram excluídos da análise os registros com status igual à “entered-in-error” e com a variável "dt deleted" preenchida.

Veja também:

Metodologia Planos de Análise e Códigos-Fonte