Regulamentação7 min de leitura

Dados Abertos em Saúde Pública: Transparência, Pesquisa e Limitações Éticas

Como dados abertos em saúde contribuem para transparência e pesquisa, com análise das limitações éticas, privacidade e desafios de implementação.

Dr. Ricardo Campos20 de outubro de 20257 min

# Dados Abertos em Saúde Pública: Transparência, Pesquisa e Limitações Éticas

O Brasil produz volumes imensos de dados em saúde pública: internações, procedimentos, mortalidade, nascimentos, vacinação, notificações compulsórias. Parte desses dados está disponível publicamente, alimentando pesquisa, jornalismo investigativo e controle social. Mas o equilíbrio entre transparência e privacidade é delicado — e frequentemente mal resolvido.

O ecossistema de dados abertos em saúde no Brasil

Principais bases disponíveis

DATASUS / TabNet:

  • SIH (Sistema de Informações Hospitalares) — internações por AIH
  • SIA (Sistema de Informações Ambulatoriais) — produção ambulatorial
  • SIM (Sistema de Informações sobre Mortalidade) — óbitos
  • SINASC (Sistema de Informações de Nascidos Vivos) — nascimentos
  • SINAN (Sistema de Informação de Agravos de Notificação) — doenças notificáveis
  • SI-PNI (Sistema de Informação do Programa Nacional de Imunizações) — vacinação

Na prática: A conformidade regulatória em saúde digital não é obstáculo à inovação — é requisito que protege pacientes, profissionais e instituições de riscos evitáveis.

CNES:

  • Cadastro Nacional de Estabelecimentos de Saúde
  • Dados de infraestrutura, equipamentos e profissionais por estabelecimento

ANS:

  • Dados de saúde suplementar
  • Beneficiários, operadoras, reclamações

Plataforma de Ciência de Dados (PCDaS / Fiocruz):

  • Dados integrados de múltiplas fontes
  • Ferramentas de análise online

Formatos e acesso

  • TabNet: interface web com consultas tabuladas
  • Microdados: arquivos para download (CSV, DBF)
  • APIs: acesso programático (em evolução)
  • OpenDataSUS: portal de dados abertos do Ministério da Saúde

Valor dos dados abertos para pesquisa

Epidemiologia

Dados do SIM, SINASC e SINAN permitem:

  • Análise de tendências de mortalidade por causa
  • Identificação de clusters geográficos de doenças
  • Avaliação de impacto de políticas públicas (vacinação, saneamento)
  • Vigilância epidemiológica em tempo quase real

Avaliação de serviços

Dados do SIH e SIA permitem:

  • Comparação de indicadores entre hospitais e regiões
  • Identificação de vazios assistenciais
  • Análise de tempo de permanência e reinternação
  • Avaliação de acesso a procedimentos de alta complexidade

Economia da saúde

  • Custo de internações por patologia
  • Distribuição de recursos entre regiões
  • Impacto econômico de doenças preveníveis
  • Custo-efetividade de intervenções

Jornalismo e controle social

Jornalistas investigativos utilizam dados abertos para:

  • Identificar desvios de recursos
  • Mapear desigualdades regionais
  • Monitorar filas de procedimentos
  • Acompanhar cobertura vacinal

Limitações dos dados disponíveis

Qualidade e completude

  • Campos obrigatórios deixados em branco ou preenchidos com "ignorado"
  • Codificação incorreta de CID (diagnósticos genéricos como "outras causas")
  • Subnotificação (nem tudo que acontece é registrado nos sistemas)
  • Atraso na alimentação (dados disponíveis com meses de defasagem)
  • Variação de qualidade entre municípios

Viés de seleção

  • Dados do SIH cobrem apenas internações SUS (não inclui saúde suplementar)
  • Dados ambulatoriais dependem do registro de produção (há incentivo para registrar procedimentos que geram repasse, não necessariamente tudo que é feito)
  • Populações sem acesso ao sistema de saúde não aparecem em nenhuma base

Fragmentação

  • Cada sistema tem sua lógica, periodicidade e granularidade
  • Linkage entre bases (cruzar o mesmo paciente em diferentes sistemas) é tecnicamente difícil
  • Identificadores inconsistentes entre sistemas
  • Mudanças de schema ao longo do tempo dificultam séries históricas

Limitações éticas e de privacidade

Reidentificação

Mesmo dados "anonimizados" podem permitir reidentificação:

  • Combinação de idade + sexo + município + diagnóstico raro pode identificar indivíduos
  • Em municípios pequenos, qualquer internação específica é potencialmente identificável
  • Doenças estigmatizantes (HIV, transtornos psiquiátricos, tentativa de suicídio) requerem proteção especial

O dilema granularidade versus privacidade

  • Dados mais detalhados (por município, por faixa etária estreita) são mais úteis para pesquisa
  • Mas são também mais facilmente reidentificáveis
  • A agregação que protege a privacidade pode ocultar desigualdades locais

LGPD e dados de saúde pública

A LGPD (Lei 13.709/2018) prevê bases legais para tratamento de dados em saúde pública:

  • Art. 7, inciso III: tratamento pela administração pública para políticas públicas
  • Art. 11, inciso II, f: tutela da saúde em procedimento realizado por profissionais de saúde
  • Art. 13: estudos em saúde pública com anonimização

Mas a lei não isenta de responsabilidade: o tratamento deve ser proporcional, necessário e com medidas de segurança.

Consentimento em dados secundários

Dados coletados no atendimento são reutilizados para fins estatísticos e epidemiológicos sem consentimento individual — isso é previsto em lei. Mas o cidadão deve ser informado sobre essa possibilidade (transparência).

Boas práticas em dados abertos de saúde

Para quem publica

  1. Documentação clara — dicionário de variáveis, metodologia de coleta, limitações conhecidas
  2. Temporalidade — data de referência e data de disponibilização
  3. Granularidade adequada — detalhe suficiente para análise sem permitir reidentificação
  4. Formato acessível — CSV, JSON, API — não apenas PDFs ou sistemas proprietários
  5. Regularidade — atualização em cronograma previsível
  6. Metadados — o que mudou entre versões, descontinuidades metodológicas

Para quem usa

  1. Entender limitações — dados administrativos não são dados epidemiológicos puros
  2. Validar achados — cruzar com outras fontes antes de publicar conclusões
  3. Contextualizar — subnotificação, viés de acesso e mudanças de definição afetam séries
  4. Ética na publicação — não publicar análises que permitam identificação
  5. Reconhecer incertezas — intervalos de confiança, não números absolutos

O futuro: RNDS e dados integrados

A Rede Nacional de Dados em Saúde (RNDS) promete integrar dados de saúde de múltiplas fontes (pública e privada) em um ecossistema conectado. Para dados abertos, isso pode significar:

  • Dados mais completos (inclui saúde suplementar)
  • Maior padronização (FHIR como linguagem comum)
  • Possibilidade de análises longitudinais (seguir o paciente entre serviços)
  • Mas também maiores riscos de privacidade se mal implementado

Dados abertos e equidade

O paradoxo

Dados abertos podem tanto revelar quanto perpetuar desigualdades:

  • Revelar: mostrar que determinada região tem mortalidade infantil acima da média
  • Perpetuar: se dados de populações marginalizadas são piores (por subnotificação), conclusões baseadas nesses dados podem subestimar necessidades

Necessidade de contextualização

Publicar dados sem contexto pode gerar interpretações prejudiciais:

  • "Hospital X tem mais mortes" pode significar que atende casos mais graves, não que presta pior assistência
  • "Região Y tem menos diagnósticos" pode refletir falta de acesso, não saúde melhor

Perguntas Frequentes

Quais dados do prontuário são protegidos pela LGPD?

Todos os dados que identificam ou podem identificar o paciente: nome, CPF, dados clínicos, resultados de exames, imagens médicas e até metadados de acesso. A LGPD classifica dados de saúde como "dados pessoais sensíveis", exigindo base legal específica e medidas de proteção reforçadas para qualquer tratamento.

O prontuário eletrônico precisa de consentimento do paciente pela LGPD?

Nem sempre. A base legal mais comum para o prontuário é a "tutela da saúde" (Art. 11, II, f), que não exige consentimento. Porém, usos secundários (pesquisa, compartilhamento com terceiros) podem exigir bases legais adicionais. O mapeamento de bases legais por finalidade é obrigação da instituição.

O que acontece se houver vazamento de dados do prontuário?

A instituição deve: notificar a ANPD e os titulares afetados quando houver risco relevante, investigar a causa, implementar medidas de contenção e documentar todo o processo. Sanções podem incluir multas de até 2% do faturamento (limitadas a R$ 50 milhões por infração), além de danos reputacionais e processos judiciais.

Conclusão

Dados abertos em saúde são um instrumento poderoso de transparência, pesquisa e controle social. O Brasil tem um acervo imenso de informações públicas, ainda subutilizado por pesquisadores e gestores. Porém, a publicação responsável exige equilíbrio: detalhe suficiente para análise útil, proteção adequada da privacidade individual e honestidade sobre limitações. Dados abertos são meio, não fim — o valor está no que fazemos com eles para melhorar a saúde da população.

dados abertos saúdeopen datatransparência saúde públicapesquisa dados SUSlimitações éticas

Artigos Relacionados

Dados Abertos em Saúde Pública: Transparência, Pesquisa e Limitações Éticas — prontuario.tech | prontuario.tech