Um grupo internacional de matemáticos liderado pelo estatístico da Universidade de Lehigh, Taeho Kim, desenvolveu uma nova maneira de gerar previsões que se alinham mais de perto com os resultados do mundo real. O método visa melhorar a previsão em várias áreas da ciência, particularmente na pesquisa em saúde, biologia e ciências sociais.
Os pesquisadores chamam sua técnica de Máximo Acordo do Preditor Linear, ou MALP. Seu objetivo central é aprimorar a correspondência entre os valores previstos e os observados. O MALP faz isso maximizando o Coeficiente de Correlação de Concordância, ou CCC. Esta medida estatística avalia como pares de números se posicionam ao longo da linha de 45 graus em um gráfico de dispersão, refletindo tanto a precisão (o quão próximos os pontos estão agrupados) quanto a exatidão (quão próximos estão dessa linha). Abordagens tradicionais, incluindo o amplamente utilizado método dos mínimos quadrados, geralmente tentam reduzir o erro médio. Embora eficazes em muitas situações, esses métodos podem falhar quando o principal objetivo é garantir um forte alinhamento entre previsões e valores reais, afirma Kim, professor assistente de matemática.
“Às vezes, não queremos apenas que nossas previsões estejam próximas — queremos que tenham o maior acordo possível com os valores reais,” explica Kim. “O problema é como podemos definir o acordo entre dois objetos de uma maneira cientificamente significativa? Uma forma de conceituar isso é observar quão próximos os pontos estão alinhados com uma linha de 45 graus em um gráfico de dispersão entre o valor previsto e os valores reais. Portanto, se o gráfico de dispersão mostrar um forte alinhamento com essa linha de 45 graus, poderíamos dizer que há um bom nível de acordo entre os dois.”
Por Que o Acordo É Mais Importante Que a Simples Correlação
Segundo Kim, as pessoas geralmente pensam primeiro no coeficiente de correlação de Pearson ao ouvir a palavra acordo, já que esse conceito é apresentado logo no início da educação estatística e continua sendo uma ferramenta fundamental. O método de Pearson mede a força de uma relação linear entre duas variáveis, mas não verifica especificamente se a relação se alinha com a linha de 45 graus. Por exemplo, ele pode detectar correlações fortes para linhas que se inclinam a 50 ou 75 graus, desde que os pontos de dados estejam próximos a uma linha reta, diz Kim.
“No nosso caso, estamos especificamente interessados no alinhamento com uma linha de 45 graus. Para isso, utilizamos uma medida diferente: o coeficiente de correlação de concordância, introduzido por Lin em 1989. Esta métrica foca especificamente em quão bem os dados se alinham com uma linha de 45 graus. O que desenvolvemos é um preditor projetado para maximizar a correlação de concordância entre valores previstos e valores reais.”
Testando o MALP com Exames Oculares e Medidas Corporais
Para avaliar o desempenho do MALP, a equipe realizou testes utilizando dados simulados e medições reais, incluindo exames oculares e avaliações de gordura corporal. Um estudo aplicou o MALP a dados de um projeto de oftalmologia que comparava dois tipos de dispositivos de tomografia de coerência óptica (OCT): o Stratus OCT mais antigo e o Cirrus OCT mais novo. À medida que os centros médicos adotam o sistema Cirrus, os médicos precisam de uma maneira confiável para traduzir medições, de modo a comparar resultados ao longo do tempo. Usando imagens de alta qualidade de 26 olhos esquerdos e 30 direitos, os pesquisadores examinaram quão precisamente o MALP poderia prever leituras do Stratus OCT a partir das medições do Cirrus OCT e compararam seu desempenho com o método dos mínimos quadrados. O MALP produziu previsões que se alinharam mais de perto com os verdadeiros valores do Stratus, enquanto os mínimos quadrados superaram ligeiramente o MALP na redução do erro médio, destacando um trade-off entre acordo e minimização de erros.
A equipe também analisou um conjunto de dados de gordura corporal de 252 adultos que incluía peso, tamanho da abdomen e outras medidas corporais. Medidas diretas do percentual de gordura corporal, como pesagem subaquática, são confiáveis, mas caras, por isso medições mais fáceis costumam ser substituídas. O MALP foi utilizado para estimar o percentual de gordura corporal e foi avaliado em relação ao método dos mínimos quadrados. Os resultados foram semelhantes ao estudo de exames oculares: o MALP entregou previsões que se aproximaram mais dos valores reais, enquanto os mínimos quadrados novamente apresentaram erros médios ligeiramente mais baixos. Esse padrão repetido ressaltou o equilíbrio constante entre acordo e minimização de erro.
Escolhendo a Ferramenta Certa para a Tarefa Certa
Kime e seus colegas observaram que o MALP frequentemente forneceu previsões que corresponderam aos dados reais de maneira mais eficaz do que as técnicas padrão. Mesmo assim, eles observam que os pesquisadores devem escolher entre o MALP e métodos mais tradicionais com base em suas prioridades específicas. Quando reduzir o erro geral é o principal objetivo, os métodos estabelecidos ainda apresentam bom desempenho. Quando a ênfase está em previsões que se alinham o mais próximo possível dos resultados reais, o MALP é frequentemente a opção mais forte.
O impacto potencial desse trabalho se estende a muitas áreas científicas. Ferramentas de previsão aprimoradas poderiam beneficiar a medicina, saúde pública, economia e engenharia. Para os pesquisadores que dependem de previsões, o MALP oferece uma alternativa promissora, especialmente quando a obtenção de um acordo próximo com os resultados do mundo real é mais importante do que simplesmente reduzir a lacuna média entre valores previstos e observados.
“Precisamos investigar mais,” diz Kim. “Atualmente, nosso trabalho está dentro da classe de preditores lineares. Este conjunto é grande o suficiente para ser utilizado praticamente em várias áreas, mas ainda é restrito do ponto de vista matemático. Portanto, desejamos estendê-lo para a classe geral, de forma que nosso objetivo seja remover a parte linear e fazer com que isso se torne o Máximo Acordo do Preditor.”
