Testarea ipotezelor privind parametrii modelului de regresie liniară


Intuitiv, dintre două modele de regresie cu același coeficient de determinare, cel construit pe baza unui eșantion mai voluminos este mai credibil. Reversul este că măsurile incertitudinii, prezentate până aici doar ca lățimi de intervale de încredere, vor fi mai ample la modelul construit cu mai puține observații. În acest capitol vom discuta situațiile în care incertitudinea este într-atât de amplă, încât pune sub semnul întrebării validitatea modelului. Spre exemplu, nu ar trebui să păstrăm în model un parametru a cărui estimație sugerează că valoarea sa este nulă.

Metoda generală de testare a ipotezelor statistice

Ipotezele statistice sunt propoziții cu formă clară, lipsită de ambiguitate, pe care statisticienii o evaluează din punct de vedere al plauzibilității, descriind-o în termeni probabilistici. O ipoteză statistică poate fi, de exemplu, că “PIBul unei țări crește, în medie, cu 30 de mii de USD/an, pentru fiecare creștere a populației cu 1”. Această propoziție ar fi ușor de accepta sau respins dacă am cunoaște toate scenariile posibile pentru această creștere a populației. Mai frecvent, vom dispune doar de un eșantion, și ne vom exprima în privința ipotezei în termeni probabilistici. Vom spune, de exemplu, că “respingem acea ipoteză la un nivel de semnificație de 0,05”, numărul indicând probabilitatea de a greși prin acceptarea aceste ipoteze.

Există mai multe strategii de a formaliza modul care evaluăm o ipoteză cu uneltele statisticii. Toate metodele conduc la rezultate similare, cu excepția metodei Fisher, în care sarcina cititorului este mai complicată. Pe scurt, metoda Fisher presupune comunicarea rezultatelor procesării datelor din eșantion, precum și probabilitatea ca valorile observate, sau valori mai extreme, să fie datorate exclusiv întâmplării (probabilitate corespunzătoare testului; eng. p value). Cititorului îi revine obligația de a decide dacă acea probabilitate este mare sau mică, respectiv dacă datele sunt produsul întâmplării sau descriu fenomene reale (diferențe, schimbări în timp etc.) Interpretarea acestei probabilități este trecută de la cititor la analist în toate celelalte metode.

Opusul metodei Fisher este metoda clasică Neyman-Pearson, în care, înainte de a iniția un studiu, prestabilim intervale posibile pentru rezultatele studiului, în funcție de care vom interpreta rezultatele studiului. De exemplu, dacă studiem importanța procentului de participare la forța de muncă la PIB cu regresie liniară, cu modelul PIB = β₀ + β₁ · PPFM, un β₁ nul va indica lipsa acestui efect. Este practic imposibil, cu numere observate în lumea reală, să obținem valori ale estimației β̂₁ de precis zero. Mai mult, chiar și dispunând de date pentru întreaga populație, este practic imposibil să obținem un parametru β₁ precis zero. În practică, vom dori deci să distingem între două scenarii mai realiste:

  • β₁ nu diferă semnificativ de zero (propoziție numită ipoteza nulă), și
  • β₁ diferă semnificativ de zero (propoziție numită ipoteza alternativă).

Metoda Neyman-Pearson presupune identificarea modelului probabilistic care descrie distribuția lui β̂₁, precum și prestabilirea a două probabilități

  • probabilitatea erorilor de tip 1, α, zisă și nivel de semnificație, definind riscul asumat de a respinge din greșeală ipoteza nulă
  • probabilitatea erorilor de tip 2, β, definind riscul asumat de a respinge din greșeală ipoteza alternativă.

Pe baza acestor probabilități asumate, a modelului probabilistic, și a câtorva informații de bază (abatere pătratică medie etc) despre variabile, se calculează o mărime minimă a eșantionului și un interval de valori ale estimației β̂₁ pentru care ipoteza nulă va fi acceptată. (Exemplu pur ipotetic: am putea fi în situația în care studiul va fi valid dacă va evalua 200 de state, și în care vom accepta ipoteza nulă dacă estimația β̂₁ este între -100 mld. și +100 mld. USD/procent PPFM.)

La finalul studiului, în metoda Neyman-Pearson clasică, analistul va comunica atât estimația β̂₁ din eșantionul studiat, cât și, în funcție de relația acestei estimații cu intervalul descris mai sus, care din cele două ipoteze este acceptată de analist.

Din considerente practice (nu putem controla întotdeauna mărimea eșantionului), cât și de conveniență (calcularea intervalului de valori ale β̂₁ care susține ipoteza alternativă poate fi solicitantă), se practică două variații ale metodei Neyman-Pearson, detaliate mai jos.

Testarea ipotezelor folosind regiuni critice

Această metodă este relativ comună printre economiști. În esență se sprijină pe comparația dintre un indicator statistic standardizat derivat din eșantion (statistica testului) și intervale în care situarea acestuia susține o ipoteză sau alta (regiuni critice). Statisticile sunt alese astfel încât valorile numerice ce delimitează regiunile critice (valori critice) sunt previzionate de o metodă pur matematică, fiind universal valabile, până la punctul în care pot fi cuprinse într-un tabel de o pagină, independent de tipul de studiu sau de variabilă analizate. Valorile critice vor depinde de un nivel de semnificație α, preferabil definit înainte de începerea studiului (frecvent se subînțelege α=0,05).

De exemplu, la evaluarea ipotezelor ce implică o medie de populație (de ex, “media veniturilor românilor diferă semnificativ de 20 mii EUR/an” vs “media veniturilor românilor nu diferă semnificativ de 20 mii EUR/an”), ne putem folosi de teorema limită centrală, care prevede că mediile de eșantion sunt distribuite conform unei distribuții normale, de medie egală cu media la nivel de populație, și cu varianță σ²/n, unde σ² este varianța variabilei în populație, iar n – efectivul eșantionului. Să presupunem că prestabilim nivelul de semnificație α=0,05 și efectuăm un sondaj pe n=100 respondenți, din care reiese o medie a eșantionului

Dacă metoda Neyman-Pearson clasică

provenind dintr-o distribuție teoretică. De exemplu, testarea diferenței semnificative statistic între parametrul β₀ și o constantă c va debuta cu estimarea diferenței (β̂ₒ – c) și transformarea ei într-un scor t prin împărțirea la SE[β̂ₒ].

Pe de altă parte, sarcina va include și specificarea unui nivel de semnificație α, care este probabilitatea erorii de tip 1 (adică, probabilitatea de a respinge ipoteza nulă deși ea este adevărată). Această probabilitate corespunde ariei celor două cozi extreme, în care se vor găsi eșantioante (bile ale lui Galton), chiar dacă bilele au pornit din centrul aparatului. Cu alte cuvinte, ni se va da α = 2 · CCDF, și vom avea nevoie de valoarea critică a lu t, abreviată tc, care, împreună cu (-tc),partiționează spațiul posibilităților în o zonă centrală de arie (1-α) și două cozi de arie α/2.