Pearson testul de bunătate a potrivirii pe scurt. Testul de bunăstare a potrivirii lui Pearson. Aplicarea testului Chi-pătrat pentru a testa ipoteze complexe

La testarea ipotezelor statistice despre corespondența parametrilor individuali cu legea de distribuție a variabilelor aleatoare, s-a presupus că legile de distribuție a acestor variabile sunt cunoscute. Cu toate acestea, la rezolvarea problemelor practice (în special a celor economice), modelul legii distribuției nu este în general cunoscut în prealabil, așa că devine necesar să se aleagă un model al legii distribuției care să fie în concordanță cu rezultatele observațiilor eșantionului.

Lăsa x 1 , x 2 ,...,x n este un eșantion de observații ale unei variabile aleatorii X cu funcție de distribuție continuă necunoscută F(x). Ipoteza in curs de testare H 0, afirmând că X distribuite conform legii având funcţia de repartizare F(x), egal cu funcția F 0 (x), adică se testează ipoteza nulă.

Se numesc criteriile prin care se testează ipoteza nulă a unei distribuții necunoscute criteriile de consimțământ. Luați în considerare testul de bunăstare a potrivirii lui Pearson.

Schema de testare a ipotezei nule :

1. După probă x 1 , x 2 ,..., x n construiți o serie de variații; poate fi fie discret, fie interval. Luați în considerare, pentru certitudine, seria variațională discretă

x i x 1 x2 ... x k-1 x k
m i m 1 m2 ... m k-1 m k

2. Conform studiilor anterioare sau conform datelor preliminare, aceștia fac o presupunere (acceptă o ipoteză) despre modelul legii de distribuție a unei variabile aleatoare X.

3. În conformitate cu datele eșantionului, sunt evaluați parametrii modelului selectat ai legii de distribuție. Să presupunem că legea distribuției are r parametrii (de exemplu, legea binomială are un singur parametru p; normal - doi parametri ( a 0 , σx) etc.).

4. Înlocuind estimările eșantionului ale valorilor parametrilor de distribuție, găsiți valorile teoretice ale probabilităților

, i=1,2,..., k.

5. Calculați frecvențele teoretice , unde .

6. Calculați valoarea testului de bunăstare a potrivirii lui Pearson

.

Această cantitate at tinde spre o distribuție cu grade de libertate. Prin urmare, tabelele de distribuție sunt utilizate pentru calcule.

7. Având în vedere nivelul de semnificație α, găsiți regiunea critică (este întotdeauna dreptaci); valoarea se determină din raport . Dacă valoarea numerică se încadrează în intervalul , atunci ipoteza este respinsă și se acceptă o ipoteză alternativă conform căreia modelul ales al legii de distribuție nu este confirmat de datele eșantionului, în timp ce este permisă o eroare, a cărei probabilitate este egală cu α .

Sarcina 6. Biletul de examen la matematică conține 10 sarcini. Lăsa Xvaloare aleatorie numărul de probleme rezolvate de candidați la examenul de admitere. Rezultatele examenului de matematică pentru 300 de candidați sunt următoarele:



i
x i
m i

X.

Soluţie. A face o ipoteză despre modelul legii de distribuție a unei variabile aleatoare X Să facem următoarele ipoteze:

probabilitatea de a rezolva o problemă nu depinde de rezultatul rezolvării altor probleme;

Probabilitatea de a rezolva orice problemă dată este aceeași și egală cu p, iar probabilitatea de a nu rezolva problema este egală cu q=1-p.

Cu aceste presupuneri, se poate presupune că X este supus legii distribuției binomiale (ipoteza nulă), i.e. probabilitatea ca elevul să decidă X sarcini, pot fi calculate prin formula

Să găsim estimarea parametrului p incluse în modelul (1).

Aici p este probabilitatea ca elevul să rezolve problema. Estimarea probabilității p este frecvența relativă p*, care se calculează prin formula

,

unde este numărul mediu de probleme rezolvate de un solicitant;

v- numărul de sarcini rezolvate de fiecare solicitant.

Apoi estimarea pentru p intram in forma

Înlocuiți valorile p*=0,6Și q*=1-0,6=0,4în expresia (1) și pentru diferit x i obţinem probabilităţi şi frecvenţe teoretice (Tabelul 1).

tabelul 1

Număr de grup i x i
0,0001 0,03
0,0016 0,48
0,0106 3,18
0,0425 12,75
0,1115 33,45
0,2007 60,21
0,2508 75,24
0,2150 64,50
0,1209 36,27
0,0403 12,09
0,0060 1,80

Tabelul arată că pentru grupele 1, 2, 3 și 11 frecvența teoretică este . Astfel de grupuri se unesc de obicei cu cele vecine. Valorile pentru grupurile 1, 2 și 3 pot fi combinate cu . Acest lucru pare firesc, deoarece pentru 0, 1, 2 și 3 probleme rezolvate la examen se acordă de obicei o notă nesatisfăcătoare. Combinăm și grupa 11 cu grupa 10 și facem un tabel. 2.



masa 2

Număr de grup i
x i 0-3 9-10
m i

Conform Tabelului. 2 calculați valoarea criteriului acordului:

Să setăm nivelul de semnificație α=0,05, apoi pentru gradele de libertate .

Valoare deci ipoteza nulă trebuie respinsă.

Sarcina 7. Rezultatele cântăririi a 50 de pachete de ceai alese aleatoriu sunt prezentate mai jos (în grame):

150, 147, 152, 148, 149, 153,. 151, 150,149, 147, 153, 151, 152, 151, 149, 152, 150, 148, 152, 150, 152, 151, 148, 151, 152, 150, 151, 149, 148, 149, 150, 150, 151, 149, 151, 150, 151, 150, 149, 148, 147, 153, 147, 152, 150, 151, 149, 150, 151, 153.

Estimați legea distribuției unei variabile aleatoare X– greutatea unui pachet de ceai – pentru nivelul de semnificație α=0,05.

Soluţie. Masa unui pachet de ceai este o variabilă aleatorie continuă, dar datorită faptului că cântărirea a fost efectuată cu o discreție de 1 g și intervalul este de 147÷153 g, cantitate continuă poate fi reprezentat printr-o serie variațională discretă:

Tabelul 1.

Ca model al legii distribuției, alegem legea normală, al cărei număr de parametri este r=2: un 0– așteptare matematică, σ X este abaterea standard.

Pe baza datelor eșantionului, obținem estimări pentru parametrii legii distribuției normale:

;

, s=1,68.

Pentru a calcula frecvențele teoretice, folosim valorile tabelare ale funcției Laplace Ф( z). Algoritmul de calcul este următorul:

Găsim prin valori normalizate ale unei variabile aleatorii Z valori Ф( z), și apoi FN(X):

, .

De exemplu,

x 1=147; z1\u003d (147 - 150,14) / 1,68 \u003d -1,87; Ф(–1,87)= –0,46926; FN(147)=0,03074;

Găsi ;

Găsim , iar dacă unele , atunci grupurile corespunzătoare sunt combinate.

Rezultatele calculului și sunt date în tabel. 2.

Conform tabelului, găsim conform schemei: pentru nivelul de semnificație și numărul de grade de libertate. De aici regiunea critică.

Valoarea nu este inclusă în regiunea critică, deci ipoteza că variabila aleatoare X- masa unui pachet de ceai - este supusă legii de distribuție normală, în conformitate cu datele eșantionului.

masa 2

i x i +x i +1 m i F( z i) FN(x i) FN(x i+1) =FN(x i+1)– –FN(x i)
–∞÷147 –0,50000 0,00000 0,03074 0,03074 1,537 -
147÷148 –0,46926 0,03074 0,10204 0,07130 3,563 0,237
148÷149 –0,39796 0,10204 0,24825 0,14621 7,31 0,730
149÷150 –0,25175 0,24825 0,46812 0,21987 10,99 0,813
150÷151 –0,03188 0,46812 0,69497 0,22685 11,34 0,010
151÷152 0,19497 0,69497 0,86650 0,17153 8,58 0,683
152÷153 0,36650 0,86650 0,95543 0,08893 4,45 2,794
153÷∞ 0,45543 0,95543 1,00000 0,04457 2,23 -
Σ=50 Σ=1,00000 Σ=5,267

Scopul lecțiilor: Să insufle elevilor abilitățile de testare a ipotezelor statistice. Acordați o atenție deosebită asimilării conceptelor legate de testarea ipotezelor (test statistic, erori 1 Și 2 amabil etc.). După rezolvarea fiecărei probleme, discutați despre alte opțiuni pentru concluzii cu niveluri diferite și diferite de semnificație.

Pentru această sesiune, ar trebui să pregătiți răspunsuri la următoarele întrebări:

1. Cum se modifică probabilitățile de a face o eroare de primul și al doilea fel odată cu creșterea dimensiunii eșantionului?

2. Probabilitățile de a face erori de primul și al doilea fel depind de tipul de ipoteză alternativă, de criteriul aplicat?

3. Care este caracterul unilateral al testelor de semnificație statistică?

4. Este posibil, folosind un test de semnificație statistică, să concluzionați: „Ipoteza nulă testată este adevărată”?

5. Care este diferența dintre construirea unei regiuni critice cu două fețe și construirea unui interval de încredere pentru același parametru?

Sarcina 1. au fost cercetate 200 piese finite pentru abaterea dimensiunii reale de la cea calculată. Datele grupate de cercetare sunt prezentate în Tabelul 5.

Tabelul 5

Construiți o histogramă pentru această serie statistică. După forma histogramei, formulați o ipoteză despre forma legii de distribuție (de exemplu, sugerați că valoarea studiată are o lege de distribuție normală). Selectați parametrii legii de distribuție (egale cu estimările lor pe baza datelor experimentale). Pe același grafic, construiți o funcție de densitate de probabilitate corespunzătoare ipotezei prezentate. Utilizând testul de potrivire, verificați dacă ipoteza este în concordanță cu datele experimentale. Luați nivelul de semnificație, de exemplu, egal cu 0,05 .

Soluţie. Pentru a ne face o idee despre forma legii de distribuție a cantității studiate, construim o histogramă. Pentru a face acest lucru, construim un dreptunghi pe fiecare interval, aria lui care este numeric egală cu frecvența de cădere în interval.


(fig.8.)

Prin forma histogramei, se poate presupune că valoarea studiată are o lege de distribuție normală. Estimăm parametrii legii distribuției normale (așteptările matematice și varianța) pe baza datelor experimentale, considerând mijlocul acestuia ca reprezentativ al fiecărui interval:

.

Deci, am înaintat ipoteza că valoarea studiată are o lege de distribuție normală N(5;111,6), adică are o funcție de densitate de probabilitate

.

Este mai convenabil să-i construiți graficul folosind tabele de funcții

.

De exemplu, punctul maxim și, respectiv, punctele de inflexiune au ordonate

Să calculăm măsura discrepanței dintre ipoteza propusă și datele experimentale, i.e. . Pentru a face acest lucru, mai întâi calculăm probabilitățile pentru fiecare interval în conformitate cu ipoteza

De asemenea,

Este convenabil să efectuați calculul scriind înregistrarea după cum urmează:

0,069 0,242 0,362 0,242 0,069 13,8 48,4 72,4 48,4 23,8 5,2 -6,4 -1,4 7,5 -1,8 -27,04 40,96 1,96 57,76 3,24 1,96 0,85 0,02 1,19 0,23

Deci, valoarea este calculată. Să construim o regiune critică pentru nivelul de semnificație. Numărul de grade de libertate pentru este egal cu 2 (numărul de intervale , iar trei legături sunt suprapuse pe: , și . Ca rezultat, ). Pentru un anumit nivel de semnificație și numărul de grade de libertate, găsim din tabel distribuția unei astfel de valori care .

În cazul nostru, și intervalul [ 5,99; ¥). Valoarea nu este în regiunea critică. Concluzie: ipoteza nu contrazice datele experimentale (ceea ce nu înseamnă, desigur, că ipoteza este corectă).

Sarcina 2. Sub forma unei serii statistice, sunt afișate date grupate privind timpul de funcționare a 400 de dispozitive:

Sunt aceste date în concordanță cu ipoteza că timpul de funcționare al dispozitivului are o funcție de distribuție integrală? ? Luați nivelul de semnificație, de exemplu, egal cu 0,02 .

Soluţie. Să calculăm probabilitățile care, în conformitate cu ipoteza, cad pe intervalele:

p =P(0 ;

p =P(500

p =P(1000

p = P(1500

Calculați c.

n i pi np i n i - np i (n i - np i) 2 (n i -np i) / np i
0,6324 0,2325 0,0852 0,0317 252,96 34,08 12,68 4,04 -15 14,92 3,32 16,32 222,6 11,02 0,06 2,42 6,53 0,87

Numărul de grade de libertate este de trei, deoarece numai o constrângere este impusă pentru 4 valori ale lui n Sn = n (r =4 -1=3). Pentru trei grade de libertate și nivel de semnificație b=0,02 găsim din tabelul de distribuţie c valoarea critică c =9,84. Valoarea c =9,88 este inclusă în regiunea critică. Concluzie: ipoteza contrazice datele experimentale. Respingem ipoteza și probabilitatea ca să greșim este de 0,02.

Sarcina 3. monedă aruncată 50 o singura data. 32 a căzut stema. Cu ajutorul testului de bunăstare a potrivirii „ chi-pătrat” verificați dacă aceste date sunt în concordanță cu ipoteza că moneda era simetrică.

Soluţie. Emitem ipoteza că moneda era simetrică, adică probabilitatea ca stema să cadă este 1/2 . Din experiența noastră, stema a căzut 32 ori şi 18 odată ce o cifră a căzut Calculați valoarea c V .

n i pi np i n i - np i (n i - np i) (n i - np i) / np i
1/2 1/2 1,96 1,96

Numărul de grade de libertate pentru c este r = 2–1=1; întrucât există doi termeni și o legătură este impusă pe n ν + v=50.

Pentru numărul de grade de libertate r=1și nivelul de semnificație, de exemplu, egal cu p=0,05 aflăm din tabelul de distribuţie c că P( c 3,84)=0,05 , adică regiunea valorilor critice c la nivelul de semnificație p=0,05 va fi un interval [ 3.84; ). Valoarea calculată c =3,92 cade în regiunea critică, ipoteza este respinsă. Probabilitatea ca să greșim este 0,05 .

Sarcina 4. Producătorul susține că numai în acest lot mare de produse 10% produse de calitate scăzută. Cinci produse au fost selectate la întâmplare și printre acestea au fost trei produse de calitate scăzută. Folosind lema Neyman-Pearson, construiți un criteriu și testați ipoteza conform căreia procentul produselor de calitate scăzută este într-adevăr egal cu 10 (p=0,1) față de alternativa că procentul de produse nede calitate scăzută este mai mare 10 (p=p>p). Probabilitatea erorii de tip I »0.01, adică include atât de multe puncte în regiunea critică încât probabilitatea de a respinge ipoteza testată, dacă este adevărată, este 0,01 . Această probabilitate este atribuită aproximativ pentru a nu recurge la randomizare, despre care elevii habar nu au. Dacă p=0,6, atunci care este probabilitatea unei erori de tip II?

Soluţie. Conform ipotezei p 0 \u003d 0,1 cu sens alternativ p>p . Conform lemei Neumann-Pearson, regiunea critică ar trebui să includă acele valori k, pentru care

= >C,

Unde CU este o constantă

,

k+ (5-k) ,

.

Deoarece , expresia din paranteză este nenegativă. De aceea

Aceasta înseamnă că regiunea critică ar trebui să includă pe cele ale valorilor {0,2,1,3,4,5} , care sunt mai mari decât unele , în funcție de nivelul de semnificație (de probabilitatea unei erori de primul fel). Pentru a determina în ipoteza că ipoteza este adevărată, calculăm probabilitățile

Dacă regiunea critică include valorile {3,4,5} , atunci probabilitatea unei erori de primul fel va fi egală cu

În condițiile problemei, s-a dovedit că dintre cele cinci au verificat trei produse defecte. Valoarea intră în regiunea critică. Respingem ipoteza în favoarea unei alternative, iar probabilitatea ca o facem în mod eronat este mai mică 0,01 .

Probabilitatea unei erori de tip II este probabilitatea de a accepta o ipoteză atunci când aceasta nu este adevărată. Ipoteza va fi acceptată la . Dacă probabilitatea de a fabrica un produs defect este de fapt egală cu , atunci probabilitatea de a accepta o ipoteză falsă este egală cu

Sarcina 5. Se știe că, odată cu amestecarea temeinică a aluatului, stafidele sunt distribuite în el aproximativ conform legii lui Poisson, adică. probabilitatea de a avea stafide într-o chiflă este de aproximativ , unde este numărul mediu de stafide per chiflă. Când coaceți chifle cu stafide, se bazează standardul 1000 chifle 9000 stafide. Există o suspiciune că s-au adăugat mai puține stafide în aluat decât este cerut de standard. Pentru verificare, se selectează o chiflă și se numără stafidele din ea. Construiți un criteriu de testare a cărui ipoteză este împotriva alternativei. Probabilitatea unei erori de tip I este considerată a fi de aproximativ 0,02.

Soluţie. Pentru a testa ipoteza: față de alternativa din lema Neyman-Pearson, regiunea critică ar trebui să includă acele valori pentru care

unde este o constantă.

Atunci n 1 H 1, întrucât valabilitatea sa înseamnă eficacitatea aplicării noii tehnologii).

Valoarea reală a criteriului statistic

.

Sub ipoteza concurentă H 1 valoarea critică a statisticii se găsește din condiția , i.e. , Unde t cr \u003d t 0,95 \u003d 1,96.

Din moment ce valoarea reală observată t=4,00 peste valoarea critică t cr(pentru oricare dintre ipotezele concurente luate), apoi ipoteza H 0 este respinsă, adică la nivelul de semnificație de 5%, se poate concluziona că noua tehnologie face posibilă creșterea producției medii a lucrătorilor.

Sarcina 2. Au fost efectuate două prelevări ale culturii de grâu: cu recoltare la timp și recoltare cu oarecare întârziere. În primul caz, la observarea a 8 parcele, randamentul mediu al probei a fost de 16,2 c/ha, iar abaterea standard a fost de 3,2 c/ha; în al doilea caz, la observarea a 9 parcele, aceleaşi caracteristici au fost egale cu 13,9 c/ha, respectiv 2,1 c/ha. La un nivel de semnificație de α=0,05, aflați efectul recoltării la timp asupra randamentului mediu.

Soluţie. Ipoteza de testat, de ex. valorile medii ale randamentului pentru recoltarea la timp și cu o oarecare întârziere sunt egale. Ca ipoteză alternativă, luăm ipoteza , a cărei adoptare înseamnă un impact semnificativ asupra randamentului termenilor de recoltare.

Valoarea reală observată a statisticii testului

.

Valoarea critică a statisticilor pentru o regiune unilaterală este determinată de numărul de grade de libertate l=n 1 +n 2 -2=9+8-2= =15 din condiția θ( t,l)=1–2 0,05=0,9, de unde conform tabelului t-distribuții (Anexa 6) găsim, t cr=1,75. Deoarece , apoi ipoteza H 0 admis. Aceasta înseamnă că datele disponibile ale eșantionului la nivelul de semnificație de 5% nu ne permit să presupunem că o anumită întârziere a timpului de recoltare are un impact semnificativ asupra randamentului. Subliniem încă o dată că aceasta nu înseamnă fidelitatea necondiționată a ipotezei H 0. Este posibil ca doar o dimensiune mică a eșantionului să fi făcut posibilă acceptarea acestei ipoteze, iar odată cu creșterea dimensiunilor eșantionului (numărul de locuri selectate), ipoteza H 0 vor fi respinse.

Sarcina 3. Următoarele date sunt disponibile privind randamentul grâului pe 8 parcele experimentale de aceeași dimensiune (c/ha): 26,5; 26,2; 35,9; 30,1; 32,3; 29,3; 26,1; 25,0. Există motive să credem că valoarea productivității a treia parcelă X *=35,9 înregistrat incorect. Este această valoare anormală (outlier) la nivelul de semnificație de 5%?

Soluţie. Excluzând valoarea X *=35,9, găsim pentru observațiile rămase și . Valoarea reală observată mai mare decât tabelar, de unde și valoarea X *=35,9 este anormal și trebuie aruncat.

Sarcina 4. Bucșele sunt prelucrate pe două strunguri. Au fost prelevate două probe: din bucșe realizate la prima mașină n 1=15 bucăți, la a doua mașină - n 2=18 buc. Pe baza acestor eșantioane, au fost calculate variațiile eșantionului (pentru prima mașină) și (pentru a doua mașină). Presupunând că dimensiunile bucșelor respectă legea distribuției normale, la nivelul de semnificație α=0,05, aflați dacă se poate considera că mașinile au precizie diferită.

Soluţie. Avem o ipoteză nulă, adică dispersiile de mărime ale bucșelor prelucrate pe fiecare mașină sunt egale. Luați ca ipoteză concurentă (varianța este mai mare pentru prima mașină).

.

Conform tabelului P.

Soluţie. Ipoteza de testat . Să luăm ipoteza ca alternativă. Deoarece varianța generală σ 2 este necunoscută, folosim t- Criteriul elevului. Statistica testului este . Valoarea critică a statisticilor t cr=1,83.

Din moment ce | t|>t cr(2.25>1.83), apoi ipoteza H 0 este respinsă, adică la nivelul de semnificație de 5%, predicția făcută ar trebui respinsă.

Sarcina 6. Pentru distribuţia empirică

În unele cazuri, cercetătorul nu știe dinainte după ce lege sunt distribuite valorile observate ale trăsăturii studiate. Dar poate avea motive destul de întemeiate să presupună că distribuția este supusă uneia sau alteia legi, de exemplu, normală sau uniformă. În acest caz, sunt prezentate ipotezele statistice principale și alternative de următoarea formă:

    H 0: distribuția caracteristicii observate este supusă legii distribuției A,

    H 1: distribuția caracteristicii observate diferă de A;

unde ca A poate actiona una sau alta lege de distributie: normala, uniforma, exponentiala etc.

Testarea ipotezei cu privire la legea de distribuție propusă se realizează folosind așa-numitele criterii de bunăstare a potrivirii. Există mai multe criterii de acceptare. Cel mai universal dintre ele este criteriul lui Pearson, deoarece este aplicabil oricărui tip de distribuție.

- Criteriul lui Pearson

De obicei, frecvențele empirice și teoretice diferă. Este discrepanța întâmplătoare? Criteriul Pearson răspunde la această întrebare, însă, ca orice criteriu statistic, nu dovedește validitatea ipotezei în sens strict matematic, ci doar stabilește acordul sau dezacordul acesteia cu datele observaționale la un anumit nivel de semnificație.

Deci, să se obțină distribuția statistică a valorilor caracteristicilor din eșantionul de volum, unde sunt valorile caracteristicilor observate, sunt frecvențele corespunzătoare:

Esența criteriului Pearson este de a calcula criteriul conform următoarei formule:

unde este numărul de cifre ale valorilor observate și sunt frecvențele teoretice ale valorilor corespunzătoare.

Este clar că, cu cât diferența este mai mică, cu atât distribuția empirică este mai apropiată de cea empirică, prin urmare, cu cât valoarea criteriului este mai mică, cu atât se poate susține mai fiabil că distribuțiile empirice și teoretice sunt supuse aceleiași legi.

Algoritmul criteriului Pearson

Algoritmul criteriului Pearson este simplu și constă din următorii pași:

Deci, singura acțiune non-trivială din acest algoritm este determinarea frecvențelor teoretice. Ele, desigur, depind de legea distribuției, prin urmare - pentru diferite legi sunt definite diferit.

Scopul criteriului χ 2 - Criteriul lui Pearson Criteriul χ 2 este utilizat în două scopuri: 1) pentru a compara distribuția empirică a unei trăsături cu cea teoretică - uniformă, normală sau alta; 2) pentru a compara două, trei sau mai multe distribuții empirice ale aceleiași caracteristici. Descrierea criteriului Criteriul χ 2 răspunde la întrebarea dacă valori diferite ale unei caracteristici apar cu aceeași frecvență în distribuțiile empirice și teoretice sau în două sau mai multe distribuții empirice. Avantajul metodei este că permite compararea distribuțiilor de caracteristici prezentate la orice scară, pornind de la scara numelor. În cel mai simplu caz al distribuției alternative „da – nu”, „a permis căsătoria – nu a permis căsătoria”, „a rezolvat problema – nu a rezolvat problema”, etc., putem aplica deja criteriul χ 2 . Cu cât discrepanța dintre două distribuții comparabile este mai mare, cu atât valoarea empirică a lui χ 2 este mai mare. Calculul automat al χ 2 - criteriul lui Pearson Pentru a calcula automat χ 2 - criteriul lui Pearson, este necesar să se efectueze doi pași: Pasul 1. Precizați numărul de distribuții empirice (de la 1 la 10); Pasul 2. Introduceți frecvențele empirice în tabel; Pasul 3. Obțineți un răspuns.

Avantajul criteriului Pearson este universalitatea acestuia: poate fi folosit pentru a testa ipoteze despre diverse legi de distribuție.

1. Testarea ipotezei unei distribuții normale.

Să se obțină o probă de o dimensiune suficient de mare P cu o mulțime de valori de variante diferite. Pentru comoditatea procesării sale, împărțim intervalul de la cea mai mică la cea mai mare dintre valorile variantei prin s părți egale și vom presupune că valorile opțiunilor care se încadrează în fiecare interval sunt aproximativ egale cu numărul care specifică mijlocul intervalului. După ce am numărat numărul de opțiuni care au intrat în fiecare interval, vom face așa-numitul eșantion grupat:

Opțiuni……….. X 1 X 2 … x s

frecvențe…………. P 1 P 2 … n s ,

Unde x i sunt valorile punctelor medii ale intervalelor și n i este numărul de opțiuni incluse în i al-lea interval (frecvențe empirice).



Pe baza datelor obținute, este posibil să se calculeze media eșantionului și abaterea standard a eșantionului σ B. Să verificăm ipoteza că populația generală este distribuită conform legii normale cu parametri M(X) = , D(X) = . Apoi puteți găsi numărul de numere din eșantionul de volum P, care ar trebui să fie în fiecare interval sub această ipoteză (adică frecvențe teoretice). Pentru a face acest lucru, folosind tabelul de valori al funcției Laplace, găsim probabilitatea de a lovi i- al-lea interval:

,

Unde un iȘi b i- granițe i- al-lea interval. Înmulțind probabilitățile rezultate cu dimensiunea eșantionului n, găsim frecvențele teoretice: p i = n p i.Scopul nostru este să comparăm frecvențele empirice și teoretice, care, desigur, diferă între ele, și să aflăm dacă aceste diferențe sunt nesemnificative, nu infirmă ipoteza distribuției normale a variabilei aleatoare studiate, sau sunt așa. mare că contrazic această ipoteză. Pentru aceasta, se folosește un criteriu sub forma unei variabile aleatoare

. (20.1)

Sensul ei este evident: se însumează părțile, care sunt pătratele abaterilor frecvențelor empirice de la cele teoretice de la frecvențele teoretice corespunzătoare. Se poate dovedi că, indiferent de legea distribuției reale a populației generale, legea distribuției variabilei aleatoare (20.1) la tinde spre legea distribuției (vezi prelegerea 12) cu numărul de grade de libertate. k = s - 1 – r, Unde r este numărul de parametri ai distribuției estimate estimați din datele eșantionului. Distribuția normală este caracterizată de doi parametri, deci k = s - 3. Pentru criteriul selectat se construiește o regiune critică de dreapta, determinată de condiție

(20.2)

Unde α - nivelul de semnificație. Prin urmare, regiunea critică este dată de inegalitate iar zona de acceptare a ipotezei este .

Deci, pentru a testa ipoteza nulă H 0: populația este distribuită în mod normal - trebuie să calculați valoarea observată a criteriului din eșantion:

, (20.1`)

și conform tabelului punctelor critice ale distribuției χ 2 găsiți punctul critic folosind valorile cunoscute ale lui α și k = s - 3. Dacă - se acceptă ipoteza nulă, dacă se respinge.

2. Testarea ipotezei distribuţiei uniforme.

Când se utilizează testul Pearson pentru a testa ipoteza unei distribuții uniforme a populației generale cu o densitate de probabilitate presupusă

este necesar, după calcularea valorii din eșantionul disponibil, estimarea parametrilor AȘi b dupa formulele:

Unde A*Și b*- estimări AȘi b. Într-adevăr, pentru o distribuție uniformă M(X) = , , de unde puteți obține un sistem de determinare A*Și b*: , a cărui soluție sunt expresiile (20.3).

Apoi, presupunând că , puteți găsi frecvențele teoretice folosind formulele

Aici s este numărul de intervale în care este împărțit eșantionul.

Valoarea observată a criteriului Pearson se calculează prin formula (20.1`), iar valoarea critică se calculează din tabel, ținând cont de faptul că numărul de grade de libertate k = s - 3. După aceea, limitele regiunii critice se determină în același mod ca și pentru testarea ipotezei unei distribuții normale.

3. Testarea ipotezei despre distribuția exponențială.

În acest caz, împărțind eșantionul existent în intervale de lungime egală, considerăm o secvență de opțiuni echidistantă între ele (presupunem că toate opțiunile care se încadrează în i--lea interval, ia o valoare care coincide cu mijlocul său) și frecvențele corespunzătoare n i(numărul de opțiuni eșantion incluse în i– al-lea interval). Calculăm din aceste date și luăm ca estimare a parametrului λ valoare . Apoi frecvențele teoretice sunt calculate prin formula

Apoi, se compară valorile observate și critice ale criteriului Pearson, ținând cont de faptul că numărul de grade de libertate k = s - 2.

Criteriul lui Pearson pentru testarea ipotezei despre forma legii de distribuție a unei variabile aleatoare. Testarea ipotezelor despre distribuțiile normale, exponențiale și uniforme prin criteriul Pearson. criteriul lui Kolmogorov. Metodă aproximativă de verificare a normalității distribuției, asociată cu estimări ale coeficienților de asimetrie și curtoză.

În prelegerea anterioară au fost luate în considerare ipoteze în care se presupunea că legea de distribuție a populației generale este cunoscută. Acum să testăm ipotezele despre legea propusă a distribuției necunoscute, adică vom testa ipoteza nulă că populația este distribuită după o lege cunoscută. De obicei, testele statistice pentru testarea unor astfel de ipoteze se numesc teste de bunătate.

Avantajul criteriului Pearson este universalitatea acestuia: poate fi folosit pentru a testa ipoteze despre diverse legi de distribuție.

1. Testarea ipotezei unei distribuții normale.

Să se obțină o probă de o dimensiune suficient de mare P cu o mulțime de opțiuni de semnificații diferite. Pentru confortul procesării sale, împărțim intervalul de la cea mai mică la cea mai mare dintre valorile variantei la s părți egale și vom presupune că valorile lui vari

furnicile care se încadrează în fiecare interval sunt aproximativ egale cu numărul care specifică mijlocul intervalului. După ce am numărat numărul de opțiuni care au intrat în fiecare interval, vom face așa-numitul eșantion grupat:

Opțiuni X 1 X 2 x s

frecvente P 1 P 2 n s ,

Unde x i sunt valorile punctelor medii ale intervalelor și n i- numărul de opțiuni incluse în i al-lea interval (frecvențe empirice).

Pe baza datelor obținute, este posibil să se calculeze media eșantionului și abaterea standard a eșantionului σ B. Să verificăm ipoteza că populația generală este distribuită conform legii normale cu parametri M(X) = , D(X) = . Apoi puteți găsi numărul de numere din eșantionul de volum P, care ar trebui să fie în fiecare interval sub această ipoteză (adică frecvențe teoretice). Pentru a face acest lucru, folosind tabelul de valori al funcției Laplace, găsim probabilitatea de a lovi i- al-lea interval:

Unde un iȘi b i- granițe i- al-lea interval. Înmulțind probabilitățile rezultate cu dimensiunea eșantionului n, găsim frecvențele teoretice: p i \u003d n? p i. Scopul nostru este să comparăm frecvențele empirice și teoretice, care, desigur, diferă unele de altele și să aflăm dacă aceste diferențe sunt nesemnificative, nu infirmă ipoteza distribuției normale a variabilei aleatoare studiate sau sunt atât de mari. că contrazic această ipoteză. Pentru aceasta, se folosește un criteriu sub forma unei variabile aleatoare

Sensul ei este evident: se însumează părțile, care sunt pătratele abaterilor frecvențelor empirice de la cele teoretice de la frecvențele teoretice corespunzătoare. Se poate dovedi că, indiferent de legea distribuției reale a populației generale, legea distribuției variabilei aleatoare (20.1) la tinde spre legea distribuției (vezi prelegerea 12) cu numărul de grade de libertate. k = s- 1 - r, Unde r- numărul de parametri ai distribuției estimate, estimați din datele eșantionului. Distribuția normală este caracterizată de doi parametri, deci k = s- 3. Pentru criteriul selectat se construiește o regiune critică de dreapta, determinată de condiție


Unde α - nivelul de semnificație. Prin urmare, regiunea critică este dată de inegalitate, iar regiunea de acceptare a ipotezei este .

Deci, pentru a testa ipoteza nulă H 0: populația este distribuită în mod normal - trebuie să calculați valoarea observată a criteriului din eșantion:

și conform tabelului punctelor critice ale distribuției χ 2 găsiți punctul critic folosind valorile cunoscute ale lui α și k = s- 3. Dacă - se acceptă ipoteza nulă, dacă se respinge.

2. Testarea ipotezei distribuţiei uniforme.

Când se utilizează criteriul Pearson pentru a testa ipoteza unei distribuții uniforme a populației generale cu densitatea de probabilitate așteptată

este necesar, după calcularea valorii din eșantionul disponibil, estimarea parametrilor AȘi b dupa formulele:

Unde A*Și b*- estimări AȘi b. Într-adevăr, pentru o distribuție uniformă M(X) = , , din care se poate obține un sistem de determinare A*Și b*: , a cărui soluție sunt expresiile (20.3).

Apoi, presupunând că , putem găsi frecvențele teoretice folosind formulele

Aici s este numărul de intervale în care este împărțit eșantionul.

Valoarea observată a criteriului Pearson se calculează prin formula (20.1`), iar valoarea critică se calculează din tabel, ținând cont de faptul că numărul de grade de libertate k = s- 3. După aceea, limitele regiunii critice se determină în același mod ca și pentru testarea ipotezei unei distribuții normale.

3. Testarea ipotezei despre distribuția exponențială.

În acest caz, împărțind eșantionul existent în intervale de lungime egală, considerăm o secvență de opțiuni echidistantă între ele (presupunem că toate opțiunile care se încadrează în i--lea interval, ia o valoare care coincide cu mijlocul său) și frecvențele corespunzătoare n i(numărul de opțiuni eșantion incluse în i--lea interval). Calculăm din aceste date și luăm ca estimare a parametrului λ valoare . Apoi frecvențele teoretice sunt calculate prin formula

Apoi, se compară valorile observate și critice ale criteriului Pearson, ținând cont de faptul că numărul de grade de libertate k = s- 2.

Testul \(\chi^2\) („chi-pătrat”, de asemenea „testul de bunătate a potrivirii lui Pearson”) are o aplicație extrem de largă în statistică. În termeni generali, putem spune că este folosit pentru a testa ipoteza nulă despre supunerea unei variabile aleatoare observate față de o anumită lege de distribuție teoretică (pentru mai multe detalii, vezi, de exemplu,). Formularea specifică a ipotezei testate va varia de la caz la caz.

În această postare, voi descrie cum funcționează testul \(\chi^2\) folosind un exemplu (ipotetic) din imunologie. Imaginați-vă că am efectuat un experiment pentru a determina eficiența suprimării dezvoltării unei boli microbiene atunci când anticorpii corespunzători sunt introduși în organism. În total, 111 șoareci au fost implicați în experiment, pe care i-am împărțit în două grupuri, inclusiv 57 și, respectiv, 54 de animale. Primul grup de șoareci a fost injectat cu bacterii patogene, urmat de introducerea serului sanguin care conține anticorpi împotriva acestor bacterii. Animalele din al doilea grup au servit drept martori - au primit doar injecții bacteriene. După un timp de incubație, s-a dovedit că 38 de șoareci au murit și 73 au supraviețuit. Dintre morți, 13 aparțineau primului grup, iar 25 aparțineau celui de-al doilea (control). Ipoteza nulă testată în acest experiment poate fi formulată astfel: administrarea de ser cu anticorpi nu are efect asupra supraviețuirii șoarecilor. Cu alte cuvinte, susținem că diferențele observate în supraviețuirea șoarecilor (77,2% în primul grup față de 53,7% în al doilea grup) sunt complet aleatorii și nu sunt asociate cu acțiunea anticorpilor.

Datele obținute în experiment pot fi prezentate sub forma unui tabel:

Total

Bacterii + ser

Doar bacterii

Total

Tabelele ca acesta se numesc tabele de contingență. În acest exemplu, tabelul are o dimensiune de 2x2: există două clase de obiecte („Bacterii + ser” și „Numai bacterii”), care sunt examinate în funcție de două criterii („Mort” și „Supraviețuit”). Acesta este cel mai simplu caz al unui tabel de contingență: desigur, atât numărul de clase studiate, cât și numărul de caracteristici pot fi mai mari.

Pentru a testa ipoteza nulă formulată mai sus, trebuie să știm care ar fi situația dacă anticorpii nu ar avea cu adevărat niciun efect asupra supraviețuirii șoarecilor. Cu alte cuvinte, trebuie să calculezi frecvențele așteptate pentru celulele corespunzătoare din tabelul de contingență. Cum să o facă? Un total de 38 de șoareci au murit în experiment, ceea ce reprezintă 34,2% din numărul total de animale implicate. Dacă introducerea de anticorpi nu afectează supraviețuirea șoarecilor, același procent de mortalitate ar trebui să fie observat la ambele loturi experimentale și anume 34,2%. Calculând cât este 34,2% din 57 și 54, obținem 19,5 și 18,5. Acestea sunt ratele de mortalitate așteptate în grupurile noastre experimentale. Ratele de supraviețuire așteptate sunt calculate într-un mod similar: deoarece 73 de șoareci au supraviețuit în total, sau 65,8% din numărul lor total, ratele de supraviețuire așteptate sunt 37,5 și 35,5. Să facem un nou tabel de contingență, acum cu frecvențele așteptate:

mort

Supraviețuitori

Total

Bacterii + ser

Doar bacterii

Total

După cum puteți vedea, frecvențele așteptate sunt destul de diferite de cele observate, adică. administrarea de anticorpi pare să aibă un efect asupra supraviețuirii șoarecilor infectați cu agentul patogen. Putem cuantifica această impresie folosind testul de bunăstare a potrivirii lui Pearson \(\chi^2\):

\[\chi^2 = \sum_()\frac((f_o - f_e)^2)(f_e),\]


unde \(f_o\) și \(f_e\) sunt frecvențele observate și respectiv așteptate. Însumarea se efectuează pe toate celulele tabelului. Deci, pentru exemplul luat în considerare, avem

\[\chi^2 = (13 – 19,5)^2/19,5 + (44 – 37,5)^2/37,5 + (25 – 18,5)^2/18,5 + (29 – 35,5)^2/35,5 = \]

Este \(\chi^2\) suficient de mare pentru a respinge ipoteza nulă? Pentru a răspunde la această întrebare, este necesar să găsim valoarea critică corespunzătoare a criteriului. Numărul de grade de libertate pentru \(\chi^2\) este calculat ca \(df = (R - 1)(C - 1)\), unde \(R\) și \(C\) sunt numărul de rânduri și coloane în conjugarea tabelului. În cazul nostru \(df = (2 -1)(2 - 1) = 1\). Cunoscând numărul de grade de libertate, acum putem afla cu ușurință valoarea critică \(\chi^2\) folosind funcția R standard qchisq() :


Astfel, pentru un grad de libertate, valoarea criteriului \(\chi^2\) depășește 3,841 doar în 5% din cazuri. Valoarea pe care am obținut-o, 6,79, depășește semnificativ această valoare critică, ceea ce ne dă dreptul de a respinge ipoteza nulă că nu există nicio relație între administrarea de anticorpi și supraviețuirea șoarecilor infectați. Respingând această ipoteză, riscăm să greșim cu o probabilitate mai mică de 5%.

Trebuie remarcat faptul că formula de mai sus pentru criteriul \(\chi^2\) oferă valori oarecum supraestimate atunci când se lucrează cu tabele de contingență de dimensiunea 2x2. Motivul este că distribuția criteriului \(\chi^2\) în sine este continuă, în timp ce frecvențele caracteristicilor binare („a murit” / „a supraviețuit”) sunt discrete prin definiție. În acest sens, la calcularea criteriului, se obișnuiește să se introducă așa-numitul. corectarea continuitatii, sau amendamentul Yates :

\[\chi^2_Y = \sum_()\frac((|f_o - f_e| - 0,5)^2)(f_e).\]

Pearson „Testul chi-pătrat cu Yates” date de corecție a continuității: șoareci X-pătrat = 5,7923, df = 1, valoare p = 0,0161


După cum puteți vedea, R aplică automat corecția Yates pentru continuitate ( Testul Chi-pătrat al lui Pearson cu corecția de continuitate a lui Yates). Valoarea \(\chi^2\) calculată de program a fost 5,79213. Putem respinge ipoteza nulă a lipsei efectului de anticorpi cu riscul de a greși cu o probabilitate de puțin peste 1% (valoarea p = 0,0161).