Criar Modelo de Regressão

Insights in ArcGIS Online
Insights no ArcGIS Enterprise
Insights desktop

Criar Modelo de Regressão é utilizada para modelar o relacionamento entre duas ou mais variáveis explicativas e uma variável de resposta ajustando uma equação linear para dados observados. Todo valor da variável independente (x) é associada com um valor da variável dependente (y).

Criar Modelo de Regressão utiliza Mínimos Quadrados Ordinários (OLS) como o tipo de regressão.

Exemplo

Uma organização ambiental está estudando a causa de emissões de gases de estufa por país de 1990 a 2015. A ferramenta Criar Modelo de Regressão pode ser utilizada para criar uma equação que pode estimar a quantia de emissões de gases de estufa por país baseado em variáveis explicativas como população e produto interno bruto (GDP).

Utilize o recurso Criar Modelo de Regressão

Utilize as etapas seguintes para executar o recurso de análise Criar Modelo de Regressão:

  1. Crie um mapa, gráfico ou tabela utilizando o conjunto de dados que você deseja criar um modelo de regressão.
  2. Clique no botão Ação Ação.
  3. Faça um dos seguintes:
    • Se seu cartão for um gráfico ou tabela, clique em Como isto é relacionado no painel Análise .
    • Se seu cartão for um mapa, clique na guia Localizar respostas e clique em Como isto é relacionado.
  4. Clique em Criar Modelo de Regressão.
  5. Para Escolher uma camada, selecione o conjunto de dados em que deseja criar um modelo de regressão.
  6. Para Escolher uma variável dependente, escolha o campo que deseja para explicar com seu modelo. O campo deve ser um número ou taxa/razão.
  7. Clique em Selecionar variáveis explanatórias para exibir um menu de campos disponíveis.
  8. Selecione os campos para utilizar como variáveis explicativas (também chamados de variáveis independentes).
  9. Clique em Selecionar para aplicar as variáveis explicativas.
  10. Clique no botão Visualizar para visualizar um gráfico de dispersão ou matriz de gráfico de dispersão das variáveis explicativas e dependentes, se disponível. Os gráficos de dispersão podem ser utilizados como parte da análise exploratória para seu modelo.
    Anotação:

    O botão Visualizar ficará indisponível se cinco ou mais variáveis explanatórias forem escolhidas.

  11. Clique em Executar.

O modelo de regressão é criado para seu dependente escolhido e variáveis explanatórias. Você pode agora utilizar as saídas e estatísticas para continuar a verificar a validez de modelo com análise exploratória e confirmatória.

Anotações de uso

A ferramenta Criar Modelo de Regressão pode ser localizada utilizando o botão Ação Ação em Como isto é relacionado na guia Localizar Respostas.

Um número ou campo taxa/razão pode ser escolhido como a variável dependente. A variável dependente é o campo numérico que você está tentando explicar com seu modelo de regressão. Por exemplo, se você estiver criando um modelo de regressão para determinar as causas da mortalidade infantil, a taxa de mortalidade infantil será a variável dependente.

Até 20 campos de número ou taxa/proporção podem ser escolhidos como variáveis explanatórias. As variáveis explanatórias são variáveis independentes que podem ser escolhidas como parte do modelo de regressão para explicar a variável dependente. Por exemplo, se você estiver criando um modelo de regressão para determinar as causas de mortalidade infantil, então as variáveis explanatórias poderão incluir taxas de pobreza, taxas de doenças e taxas de vacinação. Se o número de variáveis explanatórias escolhidas for quatro ou menos, um gráfico de dispersão ou matriz de gráfico de dispersão poderá ser criado clicando clicando em Visualizar.

Os seguintes valores de saída serão fornecidos em Estatística do Modelo:

  • Equação de regressão
  • R2
  • R2 Ajustado
  • Teste Durbin-Watson
  • valor-p
  • Erro padrão de residual
  • estatística F

As saídas e estatísticas podem ser utilizadas para analisar a exatidão do modelo.

Após você criar o modelo, um novo conjunto de dados de função é adicionado ao painel de dados. O conjunto de dados de função pode ser utilizado no recurso Prever Variável . Criar Modelo de Regressão também cria um conjunto de dados resultante que inclui todos os campos da entrada mais os campos estimated, residual e standardized_residual. Os campos contêm as seguintes informações:

  • estimated—O valor da variável dependente como estimado pelo modelo de regressão
  • residual—A diferença entre o valor de campo original e o valor estimado da variável dependente
  • standardized_residual— A razão do residual e o desvio padrão do residual

Como funciona a ferramenta Criar Modelo de Regressão

Um modelo Mínimos Quadrados Ordinários pode ser criado se as suposições seguintes forem atendidas:

  • O modelo deve ser linear nos parâmetros.
  • Os dados são uma amostra aleatória da população.
  • As variáveis independentes não são muito colineares.
  • As variáveis independentes são medidas de forma precisa já que o erro medido é desprezível.
  • O valor esperado dos residuais é sempre zero.
  • Os residuais têm discrepância constante (discrepância homogênea).
  • Os residuais são normalmente distribuídos.

A ferramenta Criar Modelo de Regressão geralmente é executada com sucesso, mesmo que uma ou mais das suposições não sejam atendidas. Portanto, as suposições para o OLS devem ser testadas antes de utilizar a ferramenta Criar Modelo de Regressão. Se as suposições não forem atendidas, o modelo pode não ser válido.

Um modelo não pode ser criado se a terceira suposição—as variáveis independentes não são muito fortemente colineares—não for atendida. Neste caso, a mensagem Duas ou mais variáveis explanatórias estão relacionadas. Remova uma das variáveis colineares e tente novamente aparece. Você pode determinar quais variáveis são colineares utilizando um gráfico de dispersão ou matriz do gráfico de dispersão. As variáveis colineares terão um relacionamento linear e uma das variáveis dependerá fortemente da outra. Remova a variável colinear dependente do modelo.

Para mais informações sobre as suposições de modelos OLS, consulte Análise de regressão.