Modele de regresie multipla

La statistique F est la statistique de test du test F sur le modèle de régression. Le test F recherche une relation de régression linéaire significative entre la variable de réponse et les variables de prédicteur. Le problème de calcul général qui doit être résolu dans l`analyse de régression multiple est d`adapter une ligne droite à un certain nombre de points. Si l`expérimentat avait effectué des mesures à trois valeurs différentes du vecteur variable indépendant X {displaystyle X}, l`analyse de régression fournirait un ensemble unique d`estimations pour les trois paramètres inconnus dans β {displaystyle beta}. Estimations de coefficient pour la régression linéaire multiple, retournées sous forme de vecteur numérique. b est un vecteur p-by-1, où p est le nombre de prédicteurs dans X. Si les colonnes de X sont dépendantes linéairement, la régresse définit le nombre maximal d`éléments de b à zéro. Retour de notre attention sur le cas de la ligne droite: compte tenu d`un échantillon aléatoire de la population, nous estimons les paramètres de la population et obtenons l`échantillon modèle de régression linéaire: la régression multiple est une technique séduisante: «brancher» autant de variables prédictitrices comme vous pouvez le penser et généralement au moins quelques-uns d`entre eux vont sortir significatif. C`est parce que vous capitaliser sur le hasard quand il suffit d`inclure autant de variables que vous pouvez penser comme prédicteurs d`une autre variable d`intérêt. Ce problème est aggravé lorsque, en outre, le nombre d`observations est relativement faible. Intuitivement, il est clair que vous pouvez difficilement tirer des conclusions d`une analyse de 100 éléments de questionnaire fondés sur 10 répondants. La plupart des auteurs recommandent que vous ayez au moins 10 à 20 fois plus d`observations (cas, répondants) que vous avez des variables; Sinon, les estimations de la ligne de régression sont probablement très instables et peu susceptibles de se reproduire si vous reconduisez l`étude.

La régression linéaire multiple, contrairement à la régression linéaire simple, implique plusieurs prédicteurs et le test de chaque variable peut rapidement devenir compliqué. Par exemple, supposons que nous appliquons deux tests distincts pour deux prédicteurs, disons (X_1 ) et (X_2 ), et les deux tests ont des valeurs de p élevées. Un test suggère (X_1 ) n`est pas nécessaire dans un modèle avec tous les autres prédicteurs inclus, tandis que l`autre test suggère (X_2 ) n`est pas nécessaire dans un modèle avec tous les autres prédicteurs inclus. Mais, cela ne signifie pas nécessairement que les deux (X_1 ) et (X_2 ) ne sont pas nécessaires dans un modèle avec tous les autres prédicteurs inclus. Il peut bien s`avérer que nous feriez mieux d`omettre soit (X_1 ) ou (X_2 ) à partir du modèle, mais pas les deux. Comment alors déterminons-nous ce qu`il faut faire? Nous examinerons cette question plus avant dans la leçon 6. Bien que les paramètres d`un modèle de régression sont généralement estimés à l`aide de la méthode des moindres carrés, d`autres méthodes qui ont été utilisées comprennent: dans le nuage de nuages, nous avons une variable indépendante ou X, et une variable dépendante ou Y. Ces variables peuvent, par exemple, représenter le QI (renseignement mesuré par un test) et le rendement scolaire (moyenne des points de grade; GPA), respectivement. Chaque point de l`intrigue représente un étudiant, c`est-à-dire le QI et l`amp de l`étudiant respectif. L`objectif des procédures de régression linéaire est d`adapter une ligne à travers les points.

Plus précisément, le programme calculera une ligne afin que les écarts quadratiques des points observés à partir de cette ligne soient minimisés. Ainsi, cette procédure générale est parfois aussi appelée estimation des moindres carrés. Il s`agit d`un problème fréquent dans de nombreuses analyses de corrélation. Imaginez que vous avez deux prédicteurs (variables X) de la hauteur d`une personne: (1) poids en livres et (2) poids en onces. Évidemment, nos deux prédicteurs sont complètement redondants; poids est une seule et même variable, qu`elle soit mesurée en livres ou en onces.

Posted in Bez kategorii