Utilizar Criar Modelo de Regressão

Insights in ArcGIS Online
Insights no ArcGIS Enterprise
Insights desktop

Criar Modelo de Regressão modela o relacionamento entre duas ou mais variáveis explicativas e uma variável de resposta ajustando uma equação linear para dados observados. Todo valor da variável independente (x) é associada com um valor da variável dependente (y).

Criar Modelo de Regressão utiliza Mínimos Quadrados Ordinários (OLS) como o tipo de regressão.

Exemplo

Uma organização ambiental está estudando a causa de emissões de gases de estufa por país de 1990 a 2015. A ferramenta Criar Modelo de Regressão pode ser utilizada para criar uma equação que pode estimar a quantia de emissões de gases de estufa por país baseado em variáveis explicativas como população e produto interno bruto.

Executar Criar Modelo de Regressão

Use as etapas a seguir para criar um modelo de regressão:

  1. Crie um mapa, gráfico ou tabela utilizando o conjunto de dados que você deseja criar um modelo de regressão.
  2. Clique no botão Ação Ação.
  3. Faça um dos seguintes:
    • Para cartões de gráfico e tabela, clique em Como está relacionado no painel Análise.
    • Para um cartão de mapa, clique na guia Localizar respostas e clique em Como isto está relacionado.
  4. Clique em Criar Modelo de Regressão.
  5. Para Escolher uma camada, selecione o conjunto de dados a ser usado para criar um modelo de regressão.
  6. Para Escolher uma variável dependente, escolha o campo que deseja para explicar com o modelo.

    O campo deve ser um número ou taxa/razão.

  7. Clique em Selecionar variáveis explanatórias para exibir um menu de campos disponíveis.
  8. Selecione os campos para utilizar como variáveis explicativas (também chamados de variáveis independentes).
  9. Clique em Selecionar para aplicar as variáveis explicativas.
  10. Clique no botão Visualizar para visualizar um gráfico de dispersão ou matriz de gráfico de dispersão das variáveis explicativas e dependentes, se disponível.
    Os gráficos de dispersão podem ser utilizados como parte da análise exploratória para o modelo.
    Anotação:

    O botão Visualizar ficará indisponível se cinco ou mais variáveis explanatórias forem selecionadas.

  11. Clique em Executar.

O modelo de regressão é criado para as variáveis ​​dependentes e explicativas especificadas. Você pode agora utilizar as saídas e estatísticas para continuar a verificar a validez de modelo com análise exploratória e confirmatória.

Anotações de uso

Para acessar Criar Modelo de Regressão, clique no botão Ação Ação em Como isso está relacionado na guia Encontrar Respostas.

Um campo de número ou taxa/proporção pode ser especificado como variável dependente. A variável dependente é o campo numérico que você está tentando explicar com o modelo de regressão. Por exemplo, se você estiver criando um modelo de regressão para determinar as causas da mortalidade infantil, a taxa de mortalidade infantil será a variável dependente.

Até 20 campos de número ou taxa/proporção podem ser especificados como variáveis ​​explicativas. As variáveis explanatórias são variáveis independentes que podem ser especificadas como parte do modelo de regressão para explicar a variável dependente. Por exemplo, se você estiver criando um modelo de regressão para determinar as causas de mortalidade infantil, então as variáveis explanatórias poderão incluir taxas de pobreza, taxas de doenças e taxas de vacinação. Se o número de variáveis explanatórias for quatro ou menos, um gráfico de dispersão ou matriz de gráfico de dispersão poderá ser criado clicando clicando em Visualizar.

Os seguintes valores de saída estão disponíveis em Estatísticas do modelo:

  • Equação de regressão
  • R2
  • R2 Ajustado
  • Teste Durbin-Watson
  • valor-p
  • Erro padrão de residual
  • estatística F

As saídas e estatísticas podem ser utilizadas para analisar a exatidão do modelo.

Após você criar o modelo, um novo conjunto de dados de função é adicionado ao painel de dados. O conjunto de dados de função pode ser utilizado no recurso Prever Variável . Criar Modelo de Regressão também cria um conjunto de dados resultante que inclui todos os campos da entrada mais os campos estimated, residual e standardized_residual. Os campos contêm as seguintes informações:

  • estimated—O valor da variável dependente como estimado pelo modelo de regressão
  • residual—A diferença entre o valor de campo original e o valor estimado da variável dependente
  • standardized_residual— A razão do residual e o desvio padrão do residual

Como funciona a ferramenta Criar Modelo de Regressão

Um modelo de regressão OLS pode ser criado se as seguintes premissas forem atendidas:

  • O modelo deve ser linear nos parâmetros.
  • Os dados são uma amostra aleatória da população.
  • As variáveis ​​independentes não são fortemente colineares.
  • As variáveis ​​independentes são medidas com precisão para que o erro de medição seja insignificante.
  • O valor esperado dos residuais é sempre zero.
  • Os residuais têm discrepância constante (discrepância homogênea).
  • Os residuais são normalmente distribuídos.

A ferramenta Criar Modelo de Regressão geralmente é executada com sucesso, mesmo que uma ou mais das suposições não sejam atendidas. As suposições para o OLS devem ser testadas antes de utilizar a ferramenta Criar Modelo de Regressão. Se as suposições não forem atendidas, o modelo pode não ser válido.

Um modelo não pode ser criado se a terceira suposição—as variáveis independentes não são fortemente colineares—não for atendida. Nesse caso, as Duas ou mais variáveis ​​explicativas estão relacionadas. Remova uma das variáveis colineares e tente novamente. mensagem aparece. Você pode determinar quais variáveis são colineares utilizando um gráfico de dispersão ou matriz do gráfico de dispersão. As variáveis colineares terão um relacionamento linear e uma das variáveis dependerá fortemente da outra. Remova a variável colinear dependente do modelo.

Para mais informações sobre as suposições de modelos OLS, consulte Análise de regressão.