Conjuntos de dados de funções

Insights in ArcGIS Online
Insights no ArcGIS Enterprise
Insights desktop

Os conjuntos de dados de funções são criados como uma saída da ferramenta Criar Modelo de Regressão . Um conjunto de dados de função contém a equação e estatística de um modelo de regressão.

Utilizar um conjunto de dados de função

Os conjuntos de dados de função são utilizados como o modelo de regressão de entrada de Prever Variável. Você pode abrir Prever Variável arrastando um conjunto de dados da função para um cartão de mapa.

Você pode criar um gráfico de pontos mostrando os coeficientes e intervalos de confiança para a interceptação e cada variável explicativa expandindo um conjunto de dados de função no painel de dados e clicando em Visualizar intervalos de confiança.

Dica:

Drag-N Drop Arraste um conjunto de dados de função sobre o gráfico de pontos criado a partir de um modelo de regressão diferente para comparar os intervalos de confiança das variáveis explicativas entre modelos.

Estatística

Os conjuntos de dados de função armazenam a equação e estatísticas de um modelo de regressão. As estatísticas podem ser visualizadas expandindo o conjunto de dados de função no painel de dados ou abrindo a tabela de dados.

As estatísticas seguintes estão disponíveis no painel de dados:

EstatísticaDescrição

Equação de regressão

A equação de regressão está no seguinte formato:

y=b0+b1x1+b2x2+...+bnxn

onde y é a variável dependente, bn representa os parâmetros calculados, e xn representa as variáveis explanatórias.

R2

O valor R2 , também conhecido como o coeficiente de determinação, é um número entre 0 e 1 que mede quão bem a linha de melhor ajuste modela os pontos de dados, com valores mais próximos de 1 indicando modelos mais precisos.

R2 Ajustado

O valor R2 ajustado também é uma medida entre 0 e 1, mas é responsável por preditores adicionais que podem causar um melhor ajuste em um modelo baseado apenas no acaso. É melhor utilizar o valor R2 Ajustado quando o modelo tiver um grande número de preditores ou quando comparar modelos com diferentes números de preditores.

Durbin-Watson

O teste de Durbin-Watson mede a autocorrelação em resíduos de uma análise de regressão em uma escala de 0 a 4. Nesta escala, 0 a 2 é autocorrelação positiva, 2 não é autocorrelação e 2 a 4 é autocorrelação negativa. É melhor ter baixa autocorrelação em um modelo de regressão, ou seja, os valores do teste de Durbin-Watson mais próximos de 2 são mais favoráveis.

Anotação:

O cálculo do teste de Durbin-Watson depende da ordem dos dados. É importante que os dados sejam ordenados sequencialmente, especialmente se os dados estiverem relacionados ao tempo. Se os dados não forem ordenados corretamente, o valor do teste de Durbin-Watson poderá não ser exato.

Erro padrão de residual

O erro padrão residual mede a precisão com a qual o modelo de regressão pode prever valores com novos dados. Os valores menores indicam um modelo mais preciso. O valor dos graus residuais de liberdade também é fornecido com o erro padrão residual.

estatística F

A estatística de F é utilizada para determinar o recurso de previsão do modelo de regressão determinando se os coeficientes são significativamente diferentes de 0. A estatística de F é um valor maior ou igual a 0 e inclui dois valores de graus de liberdade, o primeiro sendo os graus de liberdade para variáveis explicativas e o segundo sendo os graus de liberdade dos residuais.

valor-p

O valor-p da estatística F é um teste de significado global para o modelo de regressão. Um valor-p é fornecido como um valor entre 0.0 e 1.0. Valores entre 0 e 0.05 indicam que o modelo global é estatisticamente significativo.

As estatísticas seguintes estão disponíveis na tabela de dados:

EstatísticaDescrição

Variável

A intercepção e os nomes das variáveis explicativas.

Coeficiente

Os valore-b da equação de regressão, que corresponde ao interceptar-y e a declividade de cada variável explicativa.

Erro padrão

O erro padrão mede a variação em cada uma das previsões no modelo. Os valores menores indicam preditores mais precisos.

valor-t

O valor-t é utilizado para determinar o recurso de previsão de cada coeficiente de regressão determinando se os coeficientes são significativamente diferentes de 0.

valor-p

O valor-p é relacionado ao valor-t e testa significado de local para os coeficientes no modelo de regressão. Um valor p é um valor entre 0,0 e 1,0. Valores entre 0.0 e 0.05 indicam que seu modelo global é estatisticamente significativo.

Intervalo de confiança

Os intervalos de confiança fornecem os limites superiores e inferiores em que você pode ter um certo grau de certeza que o coeficiente cai dentro do intervalo. Por exemplo, se o intervalo de confiança inferior a 95 porcento for 10 e o intervalo de confiança superior a 95 porcento for 15, você pode ter confiança de 95 porcento que o valor verdadeiro do coeficiente está entre 10 e 15.

Os intervalos de confiança seguintes são fornecidos à tabela de dados:

  • 90 porcento inferior
  • 90 porcento superior
  • 95 porcento inferior
  • 95 porcento superior
  • 99 porcento inferior
  • 99 porcento superior

Coeficientes padronizados

Os coeficientes padronizados são calculados padronizando os dados de forma que a discrepância das variáveis explicativas e dependentes sejam iguais a 1. Os coeficientes padronizados são particularmente úteis para comparar valores de coeficientes com as unidades de medida diferentes.

Intervalos de confiança padronizados

Os intervalos de confiança padronizados fornecem os limites superiores e inferiores em que você pode ter um certo grau de certeza que o coeficiente padronizado cai dentro do intervalo.

Os intervalos de confiança padronizados seguintes são fornecidos à tabela de dados:

  • 90% Inferior
  • 90% Superior
  • 95% Inferior
  • 95% Superior
  • 99% Inferior
  • 99% Superior

Para mais informações sobre como utilizar e interpretar as saídas estatísticas em uma conjunto de dados de função, consulte Análise de regressão.