S.2. Pearson uyğunluq testi (c2). Loqarifmik qaytarma 2 meyarının müstəqilliyi fərziyyəsinin yoxlanılması

H 0 olsun ki, F(x) = F 0 (x); alternativ hipotez Н 1: F(x) ¹ F 0 (x). Pearson-un uyğunluq testində c 2 təsadüfi kəmiyyəti statistik olaraq götürülür, onun empirik dəyəri düsturla müəyyən edilir.

burada k - tədqiq olunan SW X dəyərinin bölündüyü intervalların sayı; m i – i intervalının tezliyi; p i nəzəri paylanma qanunu üçün hesablanmış SS X-in i-ci intervala düşmə ehtimalıdır.

n ® ¥ kimi, SW c 2 s paylanmağa meyllidir l= k – r – 1 sərbəstlik dərəcəsi, burada k intervalların sayı, r eksperimental məlumatlardan hesablanmış nəzəri paylanma parametrlərinin sayıdır.

n ® ¥ tələbi vacibdir. Praktikada həcmi n ³ 50 və hər bir m i intervalında müşahidələrin sayı ən azı 5 hesab olunur. Əgər hər hansı bir intervalda m i< 5, то имеет смысл объединить соседние интервалы.

c 2 kriteriyasının tətbiqi alqoritmini təsvir edək.

1. Dəyər tapıldı

2. VI Əlavəyə uyğun olaraq seçilmiş a səviyyəsi üçün dəyərini tapın, burada l= k - r - 1.

3. Əgər £ olarsa, onda H 0 hipotezi qəbul edilir, yəni. paylanmaların nəzəri və empirik qanunlarının üst-üstə düşdüyünü güman edə bilərik; əgər
> , onda H 0 hipotezi rədd edilir.

NÜMUNƏ 29.2. Kətan toxumu əkərkən mühüm göstərici toxum yerləşdirmə dərinliyidir. Toxumların qiymətləndirilməsi üçün 100 ölçmə aparılmışdır. Ölçmə nəticələri Cədvəl 29.3-də göstərilmişdir.

Cədvəl 29.3.

c 2 meyarından istifadə edərək, SS X-nin normal paylanması haqqında H 0 hipotezini sınaqdan keçirin - toxum yerləşdirmə dərinliyi a = 0,01 əhəmiyyət səviyyəsində.

Qərar. Nümunə məlumatlarına görə S B-ni tapaq

Ekstremal intervallarda m i dəyəri olduğundan< 5, объединим их.

Cədvəl 29.4.

1. Düstura uyğun olaraq i intervalında SV X-in p i-yə dəymə ehtimallarını tapaq.

əlavələrin II Cədvəlindən istifadə edərək dəyərləri tapırıq.

İmtahan: .

Dəyəri hesablayaq:

2. l\u003d k - r - 1 \u003d 5 - 2 - 1 \u003d 2. II cədvələ görə \u003d 9.21-i tapırıq.

3. Çünki< , то гипотезу Н 0 о нормальном распределении СВ Х отвергать нет оснований.

§ 30. Nümunələrin homogenliyi haqqında fərziyyələrin yoxlanılması (parametrik olmayan meyarlar).

Qoy iki olsun müstəqil nümunələr paylanma qanunları məlum olmayan populyasiyalardan istehsal olunur. Test edilmiş hipotez H 0: F 1 (x) = F 2 (x), burada F 1 (x) və F 2 (x) naməlum paylanma funksiyalarıdır. Alternativ hipotez H 1: F 1 (x) ¹ F 2 (x).

Kolmoqorov-Smirnov meyarı. Bu meyar F 1 (x) və F 2 (x) funksiyalarının fasiləsiz olduğunu güman etmək olarsa tətbiq edilir.

Dəyər

burada n 1 , n 2 birinci və ikinci nümunələrin həcmləridir, müvafiq olaraq F 1,E (x), F 2,E (x) birinci və ikinci nümunələrin empirik paylanma funksiyalarıdır.

Əgər H 0 hipotezi kifayət qədər böyük nümunələr üçün etibarlıdırsa (n 1 ³ 50, n 2 ³ 50), paylanma Kolmoqorov paylanmasına yaxınlaşır (əlavələrin cədvəli VII). Kiçik nümunələr üçün Dcr tapmaq üçün xüsusi cədvəllərdən istifadə olunur.

H 0 hipotezi aşağıdakı kimi yoxlanılır. Əgər a
> D cr, onda fərziyyə rədd edilir, əks halda qəbul edilir.

NÜMUNƏ 30.1. Müəyyən bir dərmanın donuz balalarının böyüməsinə təsirini öyrənmək üçün təcrübə aparıldı, nəticələri cədvəl 30.1-də göstərilmişdir.

Cədvəl 30.1.

Eyni zamanda, nəzarət qrupunda olan donuz balaları preparatdan istifadə edilmədən qidalandırılmışdır (cədvəl 30.2).

Cədvəl 30.2.

Hər iki nümunənin eyni paylanma funksiyası ilə təsvir olunduğu H 0 hipotezini yoxlamaq üçün a = 0,05 əhəmiyyət səviyyəsində tələb olunur, yəni. dərman donuz balalarının böyüməsinə əhəmiyyətli təsir göstərmir.

Qərar. Bunu nəzərə alaraq hesablama məlumatlarını cədvələ daxil edəcəyik
n 1 \u003d 100, n 2 \u003d 200.

Cədvəl 30.3.

Əlavələrin VII cədvəlindən istifadə edərək tapırıq

D cr \u003d D 1 - a \u003d D 0,95 "K 0,95 \u003d 1,36.

D cr ildən< , то гипотезу Н 0 следует принять, т.е. препарат не оказывает существенного влияния на рост поросят.

Nümunələr kiçikdirsə, istifadə etmək rahatdır Wilcoxon-Whitney testi.

Onun tətbiqi üçün bir qayda tərtib edək (n 1 £ 25, n 2 £ 25). H 0: F 1 (x) = F 2 (x) hipotezini alternativ H 1: F 1 (x) ¹ F 2 (x) hipotezi ilə yoxlamaq üçün aşağıdakılar edilir:

1. İki nümunəni birinə birləşdirin və variantları artan qaydada düzün, W hesablayın - daha kiçik bir nümunənin variantının nömrələrinin cəmi.

2. Əlavənin VIII cədvəlindən tapın w aşağı.cr = w( , n 1 , n 2) və w yuxarı.cr =
\u003d (n 1 + n 2 + 1) n 1 - w aşağı cr.

Əgər w n.cr< W < w в.кр, то нет оснований отвергнуть гипотезу, в противоположном случае гипотеза Н 0 отвергается.

Qeyd 30.1.Əgər onların arasında uyğunluq variantları varsa, onda onların hər birinə uyğun variantların nömrələrini əvəz edən ümumi seriyada uyğun gələn variantların seriya nömrələrinin arifmetik ortasına bərabər dərəcələr verilir.

Qeyd 30.2. Wilcoxon-Whitney testi böyük nümunələr üçün də istifadə edilə bilər. Bu zaman w n.cr və w v.cr-in hesablanması dəyişir (bax).

NÜMUNƏ 30.2. Əmək haqqını hesablamaq üçün (c.u.) iki müəssisədə n 1 = 8 və n 2 = 9 olan iki nümunə toplanmışdır:

I-ci müəssisə 330, 390, 400, 410, 420, 450, 460, 470

II müəssisə 340, 400, 410, 420, 430, 440, 460, 480, 490

Wilcoxon-Whitney testindən istifadə edərək, H 1 fərziyyəsinə qarşı iki müəssisədə eyni əmək haqqı ilə bağlı sıfır hipotezi H 0 sınayın: əmək haqqı fərqlidir (a = 0.05).

Qərar. Ümumi variasiya seriyası yaradaq

330 ; 340; 390 ; 400 ; 400; 410 ; 410; 420 ; 420; 430; 440; 450 ; 460 ; 460; 470 ; 480; 490

1 2 34,5 4,5 6,5 6,5 8,5 8,5 10 11 1213,5 13,5 15 16 17

Yuxarıda göstərilən Wilcoxon-Whitney testini tətbiq etmək üçün ilk nümunə ən kiçik ölçüsü n 1 = 8 olan nümunə olmalıdır.

W-nin qiymətini tapaq. Bunun üçün daha kiçik seçmə variantının seriya nömrələrinin altını çəkirik və onların cəmini tapırıq:

W = 1 + 3 + 4,5 + 6,5 + 8,5 + 12 + 13,5 + 15 = 64.

w aşağı qiymətini tapın.cr = w(0,025; 8; 9) = 51.

w top.cr = (n 1 + n 2 + 1) n 1 - w n.cr = (8 + 9 + 1) × 8 - 51 = 93 dəyərini tapın.

Əlaqədən bəri w n.cr< W < w в.кр (51 < 64 < 93), то нет оснований отвергнуть гипотезу Н 0 , т.е. оплата труда на I-м и II-м предприятиях различается незначительно.

Yuxarıda müzakirə edilən üsul, bizi maraqlandıran keyfiyyət xüsusiyyəti iki dəyər aldıqda yaxşı işləyir (tromboz - yox, Mars yaşılı - çəhrayı). Üstəlik, metod Student t-testinin birbaşa analoqu olduğundan, müqayisə edilən nümunələrin sayı da ikiyə bərabər olmalıdır.

Aydındır ki, həm xüsusiyyət dəyərlərinin sayı, həm də nümunələrin sayı ikidən çox ola bilər. Belə halları təhlil etmək üçün dispersiya təhlilinə bənzər fərqli bir üsul lazımdır. Görünüşdə, indi təsvir edəcəyimiz bu üsul z meyarından çox fərqlidir, lakin əslində onların arasında çoxlu ümumi cəhətlər var.

Misal üçün uzağa getməmək üçün indicə təhlil etdiyimiz şunt trombozu problemindən başlayaq. İndi nisbəti deyil, trombozu olan xəstələrin sayını nəzərdən keçirəcəyik. Test nəticələrini cədvələ daxil edəcəyik (Cədvəl 5.1). Hər qrup üçün trombozu olan və olmayan xəstələrin sayını göstəririk. Bizdə iki əlamət var: dərman (aspirin-platsebo) və tromboz (bəli-yox); cədvəl onların bütün mümkün kombinasiyalarını göstərir, ona görə də belə bir cədvəl şərti cədvəl adlanır. Bu halda masanın ölçüsü 2x2-dir.

Sol yuxarıdan aşağı sağ küncə gedən diaqonalda yerləşən xanalara baxaq. Onlardakı rəqəmlər nəzərə çarpır daha çox nömrələr cədvəlin digər xanalarında. Bu, aspirin istifadəsi ilə tromboz riski arasında əlaqə olduğunu göstərir.

İndi Cədvələ baxaq. 5.2. Bu, aspirinin tromboz riskinə təsir etmədiyi təqdirdə əldə edəcəyimiz gözlənilən rəqəmlər cədvəlidir. Gözlənilən rəqəmləri necə hesablamaq olar, biz bir az aşağı təhlil edəcəyik, amma hələlik diqqət yetirəcəyik xarici xüsusiyyətlər masalar. Hüceyrələrdəki bir az qorxulu fraksiya rəqəmlərinə əlavə olaraq, cədvəldən daha bir fərqi görmək olar. 5.1 sağ sütundakı qruplar və alt sətirdəki tromboz üçün ümumi məlumatdır. Aşağı sağ küncdə - sınaqda olan xəstələrin ümumi sayı. Haqqında-



Qeyd edək ki, Şəkildəki qutulardakı rəqəmlər olsa da. 5.1 və 5.2 fərqlidir, sətir və sütunlardakı cəmlər eynidir.

Gözlənilən rəqəmləri necə hesablamaq olar? Plasebo 25 nəfər, aspirin qəbul etdi - 19. Şunt trombozu müayinə olunan 44 nəfərdən 24-də baş verdi, yəni 54,55% hallarda baş vermədi - 44 nəfərdən 20-də, yəni 45,45% hallarda. Biz aspirinin tromboz riskinə təsir etmədiyinə dair sıfır fərziyyəni qəbul edirik. Sonra plasebo və aspirin qruplarında 54,55% bərabər tezlikdə tromboz müşahidə edilməlidir. 25 və 19-un 54,55%-nin nə qədər olduğunu hesabladıqdan sonra müvafiq olaraq 13,64 və 10,36 alırıq. Bu, plasebo və aspirin qruplarında trombozu olan xəstələrin gözlənilən sayıdır. Eyni şəkildə, plasebo qrupunda trombozu olmayan xəstələrin gözlənilən sayını əldə edə bilərsiniz - 25-dən 45,45%, yəni aspirin qrupunda 11,36 - 19-dan 45,45%, yəni 8,64. Nəzərə alın ki, gözlənilən rəqəmlər ikinci onluq yerlərinə qədər hesablanır - sonrakı hesablamalarda belə dəqiqlik tələb olunacaq.

Cədvəl müqayisə edin. 5.1 və 5.2. Hüceyrələrdəki rəqəmlər tamamilə fərqlidir. Buna görə də, əsl mənzərə aspirinin tromboz riskinə heç bir təsiri olmasaydı müşahidə ediləndən fərqlidir. İndi qalır bu fərqləri bir ədədlə xarakterizə edəcək kriteriya qurmaq və sonra onun kritik qiymətini tapmaq - yəni F, t və ya z meyarlarında olduğu kimi hərəkət etmək.

Ancaq əvvəlcə daha bir tanış xüsusiyyəti xatırlayaq.




tədbir Konahanın halotan və morfini müqayisə edən işidir, yəni operativ ölüm nisbətinin müqayisə edildiyi hissədir. Müvafiq məlumatlar cədvəldə verilmişdir. 5.3. Cədvəlin forması cədvəllə eynidir. 5.1. Öz növbəsində, Cədvəl 5.4 kimi cədvəl. 5.2 gözlənilən rəqəmləri, yəni ölümcülliyin anesteziyadan asılı olmadığı fərziyyəsi əsasında hesablanmış rəqəmləri ehtiva edir. Əməliyyat olunan 128 nəfərdən 110-u sağ qalıb, yəni 85,94%. Anesteziya seçimi ölümə təsir etməsəydi, onda hər iki qrupda sağ qalanların nisbəti eyni olacaq və sağ qalanların sayı halotan qrupunda olacaq - 61-in 85,94% -i, yəni morfin qrupunda 52,42 - 85,94%. 67, yəni 57,58. Eyni şəkildə, gözlənilən ölüm sayını əldə edə bilərsiniz. 5.3 və 5.4-cü cədvəlləri müqayisə edək. Əvvəlki nümunədən fərqli olaraq, gözlənilən və müşahidə edilən dəyərlər arasındakı fərqlər çox azdır. Daha əvvəl öyrəndiyimiz kimi, ölüm nisbətində heç bir fərq yoxdur. Deyəsən düzgün yoldayıq.

2x2 cədvəl üçün x2 meyarları

X2 testi ("xi-kvadrat" oxuyun) nümunələrin götürüldüyü populyasiyanın parametrləri ilə bağlı heç bir fərziyyə tələb etmir - bu, bizim tanış olduğumuz qeyri-parametrik testlərdən birincisidir. Gəlin onu quraq. Birincisi, həmişə olduğu kimi, meyar tək bir nömrə verməlidir,


müşahidə edilən məlumatlar ilə gözlənilənlər arasındakı fərqin ölçüsü kimi xidmət edəcək, yəni bu halda müşahidə edilən və gözlənilən ədədlər cədvəli arasındakı fərq. İkincisi, meyar nəzərə almalıdır ki, fərq, məsələn, bir xəstədə kiçik bir gözlənilən nömrə üçün böyük birindən daha vacibdir.

x2 kriteriyasını aşağıdakı kimi müəyyən edirik:

burada O ehtiyat cədvəlinin xanasında müşahidə edilən ədəddir, E eyni xanada gözlənilən ədəddir. Toplama cədvəlin bütün xanaları üzərində aparılır. Düsturdan göründüyü kimi, müşahidə edilən və gözlənilən ədədlər arasındakı fərq nə qədər çox olarsa, xananın %2 dəyərinə töhfəsi bir o qədər çox olar. Eyni zamanda, gözlənilən sayı az olan hüceyrələr daha çox töhfə verir. Beləliklə, meyar hər iki tələbi ödəyir - birincisi, fərqləri ölçür, ikincisi, gözlənilən rəqəmlərə nisbətən onların böyüklüyünü nəzərə alır.

Şunt trombozu məlumatlarına x2 meyarlarını tətbiq edək. Cədvəldə. 5.1 müşahidə olunan rəqəmləri göstərir və cədvəldə. 5.2 - gözlənilən.


lo və eyni verilənlərdən alınan z dəyəri. Göstərilə bilər ki, 2x2 ölçülü çarpaz cədvəllər üçün X2 = z2 bərabərliyi yerinə yetirilir.

Kritik dəyər %2 tanış şəkildə tapıla bilər. Əncirdə. 5.7, tədqiq olunan xüsusiyyətlər arasında heç bir əlaqə olmadığı hal üçün 2x2 ehtiyat cədvəlləri üçün mümkün X2 dəyərlərinin paylanmasını göstərir. X2-nin dəyəri yalnız 5% hallarda 3,84-ü keçir. Beləliklə, 3.84 5% əhəmiyyətlilik səviyyəsi üçün kritik dəyərdir. Şunt trombozu nümunəsində biz 7.10 dəyər aldıq, ona görə də biz aspirin qəbulu ilə qan laxtalanması arasında heç bir əlaqənin olmadığı fərziyyəsini rədd edirik. Əksinə, Cədvəldən alınan məlumatlar. 5.3 halotan və morfinin əməliyyatdan sonrakı ölüm nisbətinə eyni təsiri fərziyyəsi ilə yaxşı uyğunlaşır.

Əlbəttə ki, bütün əhəmiyyət meyarları kimi, x2 də müəyyən bir fərziyyənin doğruluğunun ehtimal qiymətləndirməsini verir. Əslində, aspirin tromboz riskinə təsir göstərə bilməz. Əslində, halotan və morfin əməliyyat zamanı ölümə fərqli təsir göstərə bilər. Lakin meyarın göstərdiyi kimi, hər ikisi çətin ki.

X2 meyarının tətbiqi xanalardan hər hansı birində gözlənilən sayı 5-dən çox və ya bərabər olduqda etibarlıdır. Bu şərt z meyarının tətbiqi şərtinə bənzəyir.

%2 kritik dəyər ehtiyat cədvəlinin ölçüsündən, yəni müqayisə edilən müalicələrin sayından (cədvəlin sətirləri) və mümkün nəticələrin sayından (cədvəlin sütunları) asılıdır. Cədvəlin ölçüsü sərbəstlik dərəcələrinin sayı ilə ifadə edilir v:

V \u003d (r - 1) (s - 1),

burada r sətirlərin sayı, c isə sütunların sayıdır. 2x2 cədvəllər üçün v = (2 - l)(2 - l) = l var. Fərqli v üçün %2 kritik dəyərlər Cədvəldə verilmişdir. 5.7.

2x2 cədvəli vəziyyətində əvvəllər verilmiş x2 üçün düstur (yəni 1 sərbəstlik dərəcəsi ilə) bir qədər çox qiymətləndirilmiş dəyərlər verir (oxşar vəziyyət z meyarında idi). Bunun səbəbi, nəzəri x2 paylanmasının davamlı olması, hesablanmış x2 dəyərlərinin dəsti diskret olmasıdır. Praktikada bu, sıfır fərziyyənin çox tez-tez rədd edilməsinə gətirib çıxaracaq. Bu effekti kompensasiya etmək üçün Yeats korreksiyası düstura daxil edilir: (1 O - E - -

Qeyd edək ki, Yeats korreksiyası yalnız v = 1 olduqda, yəni 2x2 cədvəllər üçün tətbiq edilir.

Yeats korreksiyasını aspirin qəbulu ilə şunt trombozu arasındakı əlaqəni öyrənmək üçün tətbiq edək (Cədvəl 5.1 və 5.2):


Xatırladığınız kimi, Yates düzəlişi olmadan %2 dəyəri 7.10 idi. %2-nin düzəldilmiş dəyəri 6.635-dən az oldu - 1% əhəmiyyətlilik səviyyəsi üçün kritik dəyər, lakin yenə də 5.024-ü keçir - 2.5% əhəmiyyətlilik səviyyəsi üçün kritik dəyər.

İxtiyari fövqəladə hallar cədvəli üçün kriteriya x2

İndi fövqəladə hallar cədvəlində ikidən çox sətir və ya sütunun olması halını nəzərdən keçirək. Qeyd edək ki, z meyarı belə hallarda tətbiq edilmir.

ch. 3-də göstərdik ki, qaçış dövrlərin sayını azaldır*. Bu dəyişikliklər sizi həkimə müraciət etməyə sövq edirmi? Cədvəldə. 5.5 tədqiqat iştirakçıları arasında sorğunun nəticələrini göstərir. Bu məlumatlar qaçmağın nizamsız dövrlər üçün həkimə müraciət etmə ehtimalına təsir etmədiyi fərziyyəsini dəstəkləyirmi?

Müayinə olunan 165 qadından 69-u (yəni 42%) həkimə müraciət edib, qalan 96-sı (yəni 58%) həkimə müraciət etməyib. Əgər a

* Eyni zamanda, hesablamaların sadəliyi üçün hər üç qrupun - nəzarət, qadın idmançılar və idmançıların - ölçülərinin eyni olduğu qəbul edilmişdir. İndi real məlumatlardan istifadə edəcəyik.


qaçış həkimə müraciət etmə ehtimalına təsir etmir, onda qrupların hər birində qadınların 42% -i həkimə müraciət etməlidir. Cədvəldə. 5.6 uyğun gözlənilən dəyərləri göstərir. Həqiqi məlumatlar onlardan çox fərqlidirmi?

Bu suala cavab vermək üçün %2 hesablayırıq:

(14 - 22,58)2 (40 - 31,42)2 (9 - 9,62)2

22,58 31,42 9,62

(14 - 13,38)2 (46 - 36,80)2 (42 - 51,20)2

13,38 36,80 51,20

Fövqəladə vəziyyət cədvəlinin sətirlərinin sayı üç, sütunları ikidir, buna görə də sərbəstlik dərəcələrinin sayı v = (3 - 1)(2 - 1) = 2. Qruplararası fərqlərin olmaması fərziyyəsi düzgündürsə, sonra Cədvəldən göründüyü kimi. 5.7, %2 vaxtın 1%-dən çox olmamaqla 9.21-i keçəcək. Nəticə dəyər daha böyükdür. Beləliklə, 0.01 əhəmiyyət səviyyəsində, qaçış və menstruasiya ilə bağlı həkimə müraciətlər arasında heç bir əlaqənin olmadığı fərziyyəsini rədd edə bilərik. Bununla belə, əlaqənin mövcud olduğunu bildikdən sonra, hansı (hansı) qrupların digərlərindən fərqləndiyini göstərə bilməyəcəyik.

Beləliklə, biz %2 kriteriyası ilə tanış olduq. Onun tətbiqi qaydası budur.

Mövcud məlumatlar əsasında fövqəladə hallar cədvəli yaradın.

Hər bir cərgədə və hər bir sütundakı obyektlərin sayını sayın və bu dəyərlərin obyektlərin ümumi sayının hansı nisbətini təşkil etdiyini tapın.

Bu fraksiyaları bilərək, gözlənilən ədədləri iki onluq dəqiqliklə hesablayın - obyektlərin sayını
sətirlər və sütunlar arasında əlaqə olmasaydı, cədvəldəki hər xananı vurardı

Müşahidə olunan və gözlənilən dəyərlər arasındakı fərqləri xarakterizə edən dəyəri tapın. Əgər ehtiyat cədvəli 2x2-dirsə, Yeats korreksiyasını tətbiq edin

Sərbəstlik dərəcələrinin sayını hesablayın, əhəmiyyət səviyyəsini seçin və cədvələ uyğun olaraq. 5.7, kritik dəyəri təyin edin %2. Bunu masanız üçün aldığınız ilə müqayisə edin.

Unutmayın ki, 2x2 çarpaz cədvəllər üçün x2 meyarı yalnız bütün gözlənilən ədədlər 5-dən çox olduqda tətbiq edilir. Daha böyük cədvəllər haqqında nə demək olar? Bu halda, bütün gözlənilən ədədlər ən azı 1 olduqda və gözlənilən nömrələri 5-dən az olan xanaların nisbəti 20%-dən çox olmadıqda, %2 meyar tətbiq edilir. Bu şərtlər yerinə yetirilmədikdə, x2 meyarları yanlış nəticələr verə bilər. Bu vəziyyətdə əlavə məlumatlar toplana bilər, lakin bu həmişə mümkün deyil. Daha asan bir yol var - birdən çox satır və ya sütunu birləşdirmək. Aşağıda bunu necə edəcəyinizi sizə göstərəcəyik.

Çarpaz cədvəllərin çevrilməsi

Əvvəlki bölmədə qaçış və menstruasiya üçün həkimə baş çəkmək arasında bir əlaqənin mövcudluğunu və ya ekvivalent olaraq həkimə baş çəkmək tezliyində qruplar arasında fərqlərin mövcudluğunu qurduq. Ancaq hansı qrupların bir-birindən fərqləndiyini, hansının olmadığını müəyyən edə bilmədik. Biz dispersiya təhlilində oxşar vəziyyətlə qarşılaşdıq. Bir neçə qrupu müqayisə edərkən, dispersiya təhlili fərqlərin mövcudluğu faktını aşkar etməyə imkan verir, lakin fərqlənən qrupları göstərmir. Sonuncu, bölmədə müzakirə etdiyimiz çoxlu müqayisə prosedurları ilə edilə bilər. 4. Bənzər bir şey ehtiyat cədvəlləri ilə edilə bilər.

Masaya baxır. 5.5-də qadın idmançıların və idmançıların nəzarət qrupundan olan qadınlardan daha çox həkimə getdiyini güman etmək olar. Qadın idmançılarla qadın idmançılar arasında fərq əhəmiyyətsiz görünür.

Gəlin qadın idmançılar və idmançılar olduğu fərziyyəsini yoxlayaq

V 0,50 0,25 0,10 0,05 0,025 0,01 0,005 0,001
41 40,335 46,692 52,949 56,942 60,561 64,950 68,053 74,745
42 41,335 47,766 54,090 58,124 61,777 66,206 69,336 76,084
43 42,335 48,840 55,230 59,304 62,990 67,459 70,616 77,419
44 43,335 49,913 56,369 60,481 64,201 68,710 71,893 78,750
45 44,335 50,985 57,505 61,656 65,410 69,957 73,166 80,077
46 45,335 52,056 58,641 62,830 66,617 71,201 74,437 81,400
47 46,335 53,127 59,774 64,001 67,821 72,443 75,704 82,720
48 47,335 54,196 60,907 65,171 69,023 73,683 76,969 84,037
49 48,335 55,265 62,038 66,339 70,222 74,919 78,231 85,351
50 49,335 56,334 63,167 67,505 71,420 76,154 79,490 86,661
Əhəmiyyət səviyyəsi

J. H. Zar, Biostatistik Analiz, 2d nəşr, Prentice-Hall, Englewood Cliffs, N.J., 1984.

ki, eyni dərəcədə tez-tez həkimə gedir. Bunu etmək üçün, bu iki qrup üçün məlumatları ehtiva edən orijinal cədvəldən bir alt cədvəl seçin. Cədvəldə. 5.8 müşahidə edilən və gözlənilən rəqəmləri göstərir; olduqca yaxındırlar.

ODA. Empirik tezliklər əslində müşahidə olunan tezliklərdir.

ÜMUMİ ƏHALİNİN BÖLÜMÜ HAQQINDA FƏRZİYYƏNİN YOXLANMASI. PIRSONUN MEYARI

Daha əvvəl qeyd edildiyi kimi, paylanma növü haqqında fərziyyə nəzəri müddəalara əsaslanaraq irəli sürülə bilər. Lakin nəzəri paylanma qanunu nə qədər düzgün seçilsə də, empirik və nəzəri bölgülər arasında uyğunsuzluqlar qaçılmazdır. Təbii ki, sual yaranır: bu uyğunsuzluqlar yalnız məhdud sayda müşahidələrlə əlaqəli təsadüfi hallarla bağlıdır, yoxsa əhəmiyyətlidir və nəzəri paylanma qanununun uğursuz seçilməsi ilə bağlıdır. Razılaşma meyarı bu suala cavab verməyə xidmət edir, yəni.

ODA. Uyğunluq meyarı naməlum paylanmanın təklif olunan qanununun fərziyyəsini yoxlamaq meyarı adlanır.

Hər bir meyar üçün, yəni. müvafiq paylama, cədvəllər adətən tapdıqlarına görə tərtib edilir k kr (əlavələrə bax). Kritik nöqtə tapıldıqdan sonra nümunə məlumatlarından meyarın müşahidə edilən dəyəri hesablanır Kimə obs. Əgər a Kimə obs > k kr, onda sıfır fərziyyə rədd edilir, əgər əksinədirsə, qəbul edilir.

Ümumi əhalinin normal paylanması fərziyyəsini yoxlamaq üçün Pearson kriteriyasının tətbiqini təsvir edək. Pearson meyarı empirik və nəzəri tezliklər arasındakı uyğunsuzluğun təsadüfi olub-olmaması sualına cavab verir?

Pearson meyarı, hər hansı bir meyar kimi, fərziyyənin etibarlılığını sübut etmir, ancaq qəbul edilmiş əhəmiyyət səviyyəsində onun müşahidə məlumatları ilə razılığını və ya razılaşmadığını müəyyən edir.

Beləliklə, n ölçülü bir nümunədən empirik paylanma alınsın. Əhəmiyyətlilik a səviyyəsində sıfır fərziyyəni yoxlamaq tələb olunur: əhali normal şəkildə paylanır.

Sıfır fərziyyənin yoxlanılması meyarı belədir təsadüfi dəyişən c 2 = , empirik tezliklər haradadır; - nəzəri tezliklər.

Bu SW c 2 - k - sərbəstlik dərəcələri ilə paylamaya malikdir. Sərbəstlik dərəcələrinin sayı k=m –r -1 tənliyi ilə tapılır, m qismən seçmə intervallarının sayıdır; r paylama parametrlərinin sayıdır. üçün normal paylanma r=2 (a və s), onda k=m –3.

Sıfır fərziyyəni müəyyən bir əhəmiyyət səviyyəsində yoxlamaq üçün: əhali normal paylanmışdır, lazımdır:

1. Nümunənin orta və standart kənarlaşmasını hesablayın.

2. Nəzəri tezlikləri hesablayın,

burada n nümunənin ölçüsüdür; h - addım (iki bitişik seçim arasındakı fərq); ; funksiya dəyərləri tətbiqə baxın.

3. Pearson testindən istifadə edərək empirik və nəzəri tezlikləri müqayisə edin. Bunun üçün:



a) kriteriyanın müşahidə olunan qiymətini tapın;

b) kritik paylanma nöqtələri cədvəlinə əsasən c 2 , verilmiş əhəmiyyət səviyyəsinə və k sərbəstlik dərəcələrinin sayına görə kritik nöqtəni tapın .

Əgər a< - нет оснований отвергнуть нулевую гипотезу. Если >- Sıfır hipotezi rədd edilir.

Şərh. Bir neçə tezlik (<5) следует объединить; в этом случае и соответствующие им теоретические частоты также надо сложить. Если производилось объединение частот, то при определении числа степеней свободы следует в качестве m принять число групп выборки, оставшихся после объединения частот.

Mühazirə 6 İki Nümunə Analizi

6.1 Parametrik meyarlar. bir

6.1.2 Tələbə testi ( t-testi) 2

6.1.3 F Fişer testidir. 6

6.2 Parametrik olmayan testlər. 7

6.2.1 İşarə meyarı ( G-meyarı) 7

Əsas (nümunə) xüsusiyyətləri müəyyən etdikdən və bir nümunəni təhlil etdikdən sonra həll edilən statistik təhlilin növbəti vəzifəsi bir neçə nümunənin birgə təhlilidir. İki nümunəni təhlil edərkən ortaya çıxan ən mühüm sual nümunələr arasında fərqlərin olub-olmaması sualıdır. Adətən, bu, hər iki nümunənin eyni ümumi populyasiyaya aid olması və ya vasitələrin bərabərliyi haqqında statistik fərziyyələri yoxlamaq yolu ilə həyata keçirilir.

Nümunənin paylanma növü və ya paylama funksiyası bizə verilirsə, bu halda iki müstəqil müşahidə qrupu arasındakı fərqlərin qiymətləndirilməsi problemini istifadə edərək həll etmək olar. parametrik meyarlar statistika: ya Tələbənin t-testi ( t ), nümunələrin müqayisəsi orta qiymətlərə əsaslanırsa ( X və Y) və ya Fisher meyarından ( F ) nümunələr dispersiyalarına görə müqayisə edilərsə.

Əvvəlcə paylanma növünü yoxlamadan parametrik statistik meyarların istifadəsi müəyyən səhvlərə səbəb ola bilər.işləyən fərziyyəni sınaqdan keçirərkən.

Pedaqoji tədqiqat təcrübəsində bu çətinlikləri aradan qaldırmaq üçün istifadə edilməlidir qeyri-parametrik meyarlar statistika işarə testi, iki nümunəli Wilcoxon testi, Van der Waerden testi, Spearman testi kimi, seçimi çox sayda nümunə üzvləri və paylanma növü haqqında bilik tələb etməsə də, yenə də asılıdır. bir sıra şərtlərlə.

Parametrik olmayan statistika testləri - nümunələrin paylanması qanunu haqqında fərziyyədən azaddır və müşahidələrin müstəqilliyi fərziyyəsinə əsaslanır.

6.1 Parametrik meyarlar

Qrupa parametrik meyarlar riyazi statistikanın üsulları təsviri statistikanın hesablanması, paylanmanın normallığı üçün qrafiklərin qurulması, iki nümunənin eyni populyasiyaya aid olması haqqında fərziyyələrin yoxlanılması üsullarını əhatə edir. Bu üsullar nümunələrin paylanmasının normal (Qauss) paylanma qanununa tabe olması fərziyyəsinə əsaslanır. Statistikanın parametrik meyarları arasında biz Student və Fisher kriteriyasını nəzərdən keçirəcəyik.

6.1.1 Nümunənin normallığını yoxlamaq üsulları

Normal paylama ilə məşğul olub-olmadığımızı müəyyən etmək üçün aşağıdakı üsulları tətbiq edə bilərik:

1) oxlar daxilində bir tezlik poliqonu (empirik paylama funksiyası) və çəkə bilərsiniz normal paylanma əyrisi tədqiqat məlumatlarına əsaslanır. Normal paylanma əyrisinin formalarını və empirik paylanma funksiyasının qrafikini tədqiq etməklə sonuncu əyrinin birincidən fərqləndiyi parametrləri tapmaq olar;

2) hesablanmışdır orta, orta və rejimi və buna əsasən normal paylanmadan kənarlaşma müəyyən edilir. Mod, median və arifmetik orta bir-birindən əhəmiyyətli dərəcədə fərqlənmirsə, biz normal paylanma ilə məşğul oluruq. Əgər median ortadan əhəmiyyətli dərəcədə fərqlənirsə, onda biz asimmetrik nümunə ilə məşğul oluruq.

3) paylanma əyrisinin kurtozu 0-a bərabər olmalıdır. Müsbət kurtozu olan əyrilər normal paylanma əyrisindən xeyli şaquli olur. Mənfi kurtozu olan əyrilər normal paylanma əyrisi ilə müqayisədə daha maili olur;

4) tezlik paylanmasının orta qiymətini və standart kənarlaşmanı təyin etdikdən sonra aşağıdakı dörd paylama intervalını tapın və onları seriyanın faktiki məlumatları ilə müqayisə edin:

a) - populyasiya tezliyinin təxminən 25% -i intervala aid olmalıdır,

b) - populyasiya tezliyinin təxminən 50%-i intervala aid olmalıdır,

c) - populyasiya tezliyinin təxminən 75%-i intervala aid olmalıdır,

d) - populyasiya tezliyinin təxminən 100%-i intervala aid olmalıdır.

6.1.2 Tələbə testi ( t-testi)

Kriteriya seçmədəki hər iki vasitənin eyni populyasiyaya aid olması ehtimalını tapmağa imkan verir. Bu meyar ən çox hipotezi yoxlamaq üçün istifadə olunur: "İki nümunənin vasitələri eyni populyasiyaya aiddir".

Kriteriyadan istifadə edərkən iki halı ayırd etmək olar. Birinci halda, ikinin ümumi vasitələrinin bərabərliyi haqqında fərziyyəni yoxlamaq üçün istifadə olunur müstəqil, əlaqəsiz nümunələri (sözdə iki nümunəli t-testi). Bu halda nəzarət qrupu və eksperimental (eksperimental) qrup mövcuddur, qruplarda subyektlərin sayı fərqli ola bilər.

İkinci halda, eyni obyektlər qrupu vasitələr haqqında fərziyyələri yoxlamaq üçün ədədi material yaratdıqda, sözdə qoşalaşmış t-testi. Nümunələr çağırılır asılı, əlaqəli.

a) müstəqil nümunələr işi

Əlaqəsiz, müstəqil nümunələr üçün test statistikası:

burada , eksperimental və nəzarət qruplarında arifmetik ortadır,

Arifmetik ortalar arasındakı fərqin standart xətası. Düsturdan tapılır:

,(2)

burada n 1 və n 2 müvafiq olaraq birinci və ikinci nümunələrin dəyərləri.

Əgər n 1 \u003d n 2 olarsa, arifmetik vasitələr arasındakı fərqin standart xətası düstura görə hesablanacaqdır:

(3)

burada n nümunənin ölçüsüdür.

saymaq sərbəstlik dərəcələrinin sayı düsturla həyata keçirilir:

k \u003d n 1 + n 2 - 2. (4)

Nümunələrin ədədi bərabərliyi ilə k = 2 n - 2.

Sonra, əldə edilmiş t emp dəyərini Tələbənin t-paylanmasının nəzəri dəyəri ilə müqayisə etməlisiniz (statistika dərsliklərinə əlavəyə baxın). Əgər t emp

İstifadə nümunəsini nəzərdən keçirin t -Tələbənin əlaqəsiz və qeyri-bərabər nümunələr üçün testi.

Nümunə 1. Tələbələrin iki qrupunda - eksperimental və nəzarət - mövzu üzrə aşağıdakı nəticələr əldə edildi (test balları; Cədvəl 1-ə baxın).

Cədvəl 1. Təcrübənin nəticələri

Birinci qrup (eksperimental) N 1 =11 nəfər

İkinci qrup (nəzarət)

N 2 \u003d 9 nəfər

121413161191315151814

Nümunə üzvlərinin ümumi sayı: n 1 =11, n 2 =9.

Arifmetik ortaların hesablanması: X cf =13,636; Y cf = 9.444

Standart kənarlaşma: s x =2,460; s y =2,186

Düsturdan (2) istifadə edərək arifmetik vasitələr arasındakı fərqin standart xətasını hesablayırıq:

Kriteriyanın statistikasını hesablayırıq:

Təcrübədə alınan t-nin qiymətini sərbəstlik dərəcələrini nəzərə alaraq cədvəl dəyəri ilə müqayisə edirik, düstur (4) ilə subyektlərin sayından iki (18) çıxılmaqla bərabərdir.

t kritikin cədvəl dəyəri yüzdən beş halda səhv qərar vermək riskini nəzərə alaraq 2.1-dir (əhəmiyyət səviyyəsi = 5% və ya 0.05).

Təcrübədə alınan t-nin empirik qiyməti cədvəl dəyərindən artıq olarsa, o zaman eksperimental qrup tələbələrinin orta hesabla daha yüksək bilik səviyyəsi göstərdiyinə dair alternativ fərziyyəni (H 1) qəbul etmək üçün əsaslar vardır. Təcrübədə t=3.981, cədvəl t=2.10, 3.981>2.10, ondan eksperimental öyrənmənin üstünlüyü haqqında nəticə çıxarılır.

Burada ola bilər suallar :

1. Təcrübədə alınan t-nin qiyməti cədvəldəkindən kiçik olarsa necə? Sonra sıfır hipotezi qəbul edilməlidir.

2. Eksperimental metodun üstünlüyü sübut olunubmu? Göstərildiyi kimi o qədər də sübut olunmayıb, çünki əvvəldən yüzdən beş halda (p = 0,05) səhv etmək riskinə icazə verilir. Təcrübəmiz bu beş vəziyyətdən biri ola bilər. Lakin mümkün halların 95%-i alternativ fərziyyənin lehinə danışır və bu, statistik sübutlarda kifayət qədər inandırıcı arqumentdir.

3. Nəzarət qrupu eksperimental qrupdan daha yaxşı bal toplayırsa necə? Məsələn, eksperimental qrupun arifmetik ortasını təyin edərək, nəzarəti dəyişdirək:

Bu, yeni metodun müxtəlif, ola bilsin, səbəblərə görə hələ də yaxşı olduğunu sübut etmədiyi qənaətini nəzərdə tutur. Mütləq qiymət 3,9811>2,1 olduğundan ənənəvi metodun üstünlüyü haqqında ikinci alternativ fərziyyə (H 2) qəbul edilir.

b) əlaqəli (qoşalaşmış) nümunələrin işi

Hər birində bərabər sayda ölçmə ilə əlaqəli nümunələr olduqda, daha sadə Student t-test düsturundan istifadə edilə bilər.

t dəyərinin hesablanması düsturla aparılır:

X dəyişəni ilə Y dəyişəninin uyğun qiymətləri arasındakı fərqlər haradadır və d bu fərqlərin ortasıdır;

Sd aşağıdakı düsturla hesablanır:

(6)

Sərbəstlik dərəcələrinin sayı k k=n -1 düsturu ilə müəyyən edilir. Əlaqəli və aydın şəkildə bərabər sayda nümunələr üçün Student t-testindən istifadə nümunəsinə nəzər salın.

Əgər t emp

Misal 2. Şagirdlərin bədii-estetik dəyərlərə yönüm səviyyəsi öyrənilmişdir. Eksperimental qrupda bu oriyentasiyanın formalaşmasını aktivləşdirmək üçün söhbətlər aparılıb, uşaq rəsmlərinin sərgiləri təşkil olunub, muzeylərə və rəsm qalereyalarına səfərlər təşkil olunub, musiqiçilər, rəssamlarla görüşlər və s.. Təbii ki, sual yaranır: nə? görülən işlərin səmərəliliyi varmı? Bu işin effektivliyini yoxlamaq üçün təcrübədən əvvəl və sonra test verilmişdir. Metodoloji səbəblərə görə Cədvəl 2 az sayda fənnin nəticələrini göstərir.

Cədvəl 2. Təcrübənin nəticələri

Tələbələr

(n=10)

Xallar

Köməkçi hesablamalar

sınaq başlamazdan əvvəl (X)

Sonda

təcrübə (U)

d

d2

İvanov

Novikov

Sidorov

Piroqov

Ağapov

Suvorov

Rıjikov

Serov

Baltalar

Bıstrov

Orta

14,8

21,1

Əvvəlcə düstura görə hesablayacağıq:

Sonra (6) düsturunu tətbiq edirik, alırıq:

Nəhayət, düstur (5) tətbiq edilməlidir. Biz əldə edirik:

Sərbəstlik dərəcələrinin sayı: k \u003d 10-1 \u003d 9 və Əlavə 1-in cədvəlinə görə biz t krit \u003d 2.262, eksperimental t \u003d 6.678 tapırıq, buradan alternativ bir fərziyyənin qəbul edilməsi mümkünlüyü (H) 1) arifmetik vasitələrdə əhəmiyyətli fərqlər haqqında, yəni eksperimental təsirin effektivliyi haqqında nəticə çıxarılır.

Statistik fərziyyələr baxımından nəticə belə səslənəcək: 5% səviyyəsində H 0 hipotezi rədd edilir və H 1 hipotezi qəbul edilir.

6.1.3 F - Fisher testi

Fisher meyarı iki müstəqil nümunənin seçmə fərqlərinin dəyərlərini müqayisə etməyə imkan verir. F emp-i hesablamaq üçün iki nümunənin dispersiyalarının nisbətini tapmaq lazımdır ki, daha böyük dispersiya payda, kiçik olan isə məxrəcdə olsun. Fisher kriteriyasının hesablanması düsturu aşağıdakı kimidir:

müvafiq olaraq birinci və ikinci nümunələrin dispersiyaları haradadır.

Kriteriyanın şərtinə görə, payın dəyəri məxrəcin dəyərindən böyük və ya ona bərabər olmalıdır, Femp dəyəri həmişə birdən böyük və ya bərabər olacaqdır.

Sərbəstlik dərəcələrinin sayı da sadə şəkildə müəyyən edilir:

k 1 \u003d n l - 1 birinci nümunə üçün (yəni, dispersiya daha böyük olan nümunə üçün) və k 2 \u003d n 2 - 1 ikinci nümunə üçün.

Əlavə 1-də Fisher meyarının kritik dəyərləri k 1 (cədvəlin yuxarı sətri) və k 2 (cədvəlin sol sütunu) qiymətləri ilə tapılır.

Əgər t emp >t crit olarsa, onda sıfır fərziyyə qəbul edilir, əks halda alternativ qəbul edilir.

Misal 3İki üçüncü sinifdə on şagird TURMS testinə uyğun olaraq əqli inkişaf üçün sınaqdan keçirilmişdir. Əldə edilən orta dəyərlər əhəmiyyətli dərəcədə fərqlənmədi, lakin psixoloq siniflər arasında zehni inkişaf göstəricilərinin homojenlik dərəcəsində fərqlərin olub-olmaması sualı ilə maraqlanır.

Qərar. Fisher meyarı üçün hər iki sinifdə test ballarının fərqlərini müqayisə etmək lazımdır. Test nəticələri cədvəldə təqdim olunur:

Cədvəl 3

tələbələrin sayı

Birinci sinif

İkinci sinif

məbləğlər

Orta

60,6

63,6

X və Y dəyişənləri üçün fərqləri hesabladıqdan sonra əldə edirik:

s x 2 = 572,83; s y 2 =174,04

Sonra F Fisher meyarına görə hesablama üçün (8) düsturuna görə tapırıq:

Hər iki halda k = 10 - 1 = 9-a bərabər olan sərbəstlik dərəcələri olan F meyarı üçün Əlavə 1-dəki cədvələ əsasən F kritik = 3.18 (<3.29), следовательно, в терминах статистических гипотез можно утвер­ждать, что Н 0 (гипотеза о сходстве) может быть отвергнута на уровне 5%, а принимается в этом случае гипотеза Н 1 . Иc следователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов.

6.2 Parametrik olmayan testlər

Tədqiqatçı hər hansı məruz qalmadan əvvəl və sonrakı nəticələri gözlə (faizlə) müqayisə edərək belə nəticəyə gəlir ki, əgər fərqlər müşahidə olunursa, deməli, müqayisə edilən nümunələrdə də fərq var. Belə bir yanaşma qəti şəkildə qəbuledilməzdir, çünki faizlər üzrə fərqlərə inam səviyyəsini müəyyən etmək mümkün deyil. Öz-özünə götürülmüş faizlər statistik cəhətdən etibarlı nəticələr çıxarmağa imkan vermir. İstənilən təsirin effektivliyini sübut etmək üçün göstəricilərin yerdəyişməsində (köpüşündə) statistik əhəmiyyətli tendensiya müəyyən etmək lazımdır. Belə problemləri həll etmək üçün tədqiqatçı bir sıra fərq meyarlarından istifadə edə bilər.Aşağıda qeyri-parametrik meyarlar nəzərə alınacaq: işarə testi və xi-kvadrat testi.

6.2.1 İşarə meyarı ( G-meyarı)

Meyar iki üzvün bəzi əmlakının vəziyyətini müqayisə etmək üçün nəzərdə tutulmuşdur asılı nümunələri dərəcəsindən aşağı olmayan miqyasda aparılan ölçmələrə əsaslanır.

Təsadüfi dəyişənlər üzərində iki sıra müşahidələr mövcuddur X və Y iki nəzərə alınmaqla əldə edilir asılı nümunələr. Onlara əsaslanaraq N cüt forma (x i , y i ), harada X i , y i - eyni obyektin eyni xassəsinin ikiqat ölçülməsinin nəticələri.

Pedaqoji tədqiqatda şagirdlər, müəllimlər və məktəb rəhbərliyi tədqiqat obyekti kimi çıxış edə bilər. Eyni zamanda x i , y i məsələn, müəllimin müəyyən pedaqoji vasitədən istifadə etməzdən əvvəl və sonra eyni və ya müxtəlif işi eyni qrup şagirdlər tərəfindən ikiqat yerinə yetirməsinə görə verdiyi xal qiymətləri ola bilər.

Hər bir cütün elementləri x i , y i miqyasına görə bir-biri ilə müqayisə edilir və cütə işarə verilir «+» əgər x i< у i , işarəsi «-» əgər x i > y i «0» əgər x i = y i .

Boş hipotez aşağıdakı kimi tərtib edilir: tədqiq olunan əmlakın vəziyyətində ilkin və ikinci dərəcəli ölçülərdə əhəmiyyətli fərqlər yoxdur. Alternativ fərziyyə: kəmiyyətlərin paylanması qanunları X və Y fərqlidir, yəni tədqiq olunan əmlakın vəziyyətləri bu xassələrin ilkin və ikincil ölçülərində eyni çoxluqda əhəmiyyətli dərəcədə fərqlidir.

Kriteriya statistikası (T) aşağıdakı kimi müəyyən edilir:

Fərz edək ki, N cütdən (x, y,) dəyərlərin olduğu bir neçə cüt var x i və y i bərabərdirlər. Belə cütlər "0" işarəsi ilə işarələnir və T-nin qiyməti hesablanarkən nəzərə alınmır. Tutaq ki, N rəqəmindən "0" işarəsi ilə göstərilən cütlərin sayını çıxdıqdan sonra yalnız n buxar. Qalanlar arasında n cütlər, biz "-" işarəsi ilə göstərilən cütlərin sayını, yəni olan cütləri sayırıq. x i< y i . T və dəyəri mənfi işarəsi olan cütlərin sayına bərabərdir.

Sıfır hipotezi qəbul edilirMüşahidə olunan dəyər 0,05 əhəmiyyətlilik səviyyəsi T< n - t a , где значение n - t a Əlavə 2-nin işarə meyarı üçün statistik cədvəllərdən müəyyən edilir.

Misal 4Şagirdlər müəyyən bir anlayışı başa düşmələrini yoxlamaq üçün imtahan verdilər. Daha sonra on beş tələbəyə öyrənmə qüsuru olan tələbələrdə bu konsepsiyanı inkişaf etdirmək üçün nəzərdə tutulmuş elektron tədris aləti təklif edildi. Şagirdlər dərs vəsaitini öyrəndikdən sonra yenidən eyni nəzarət işini yerinə yetirdilər və bu iş beş ballıq sistem üzrə qiymətləndirildi.

İşin ikiqat yerinə yetirilməsinin nəticələri sifariş şkalasında (beş ballıq şkala) ölçmələri əks etdirir. Bu şərtlərdə dərs vəsaitini öyrəndikdən sonra tələbələrin biliyinin vəziyyətinin dəyişmə meylini müəyyən etmək üçün işarə meyarından istifadə etmək mümkündür, çünki bu meyarın bütün fərziyyələri yerinə yetirilir.

15 şagird tərəfindən işin ikiqat yerinə yetirilməsinin nəticələri (ballarla) cədvəl şəklində qeyd olunacaq (Cədvəl 1-ə bax).

Cədvəl 4

Tələbələr (No.)

İlk qaçış

İkinci edam

Hündürlük fərqi işarəsi

Hipotez sınaqdan keçirilir H0 : dərs vəsaiti öyrənildikdən sonra tələbələrin bilik vəziyyəti artmadı. Alternativ fərziyyə: Təlimatı öyrəndikdən sonra tələbələrin bilik vəziyyəti artdı.

Şagirdlərin aldığı qiymətlərdəki müsbət fərqlərin sayına bərabər olan T meyarının statistikasının qiymətini hesablayaq. Cədvəldəki məlumatlara görə. 4 T=10, n=12.

N-ta kriteriyasının statistikasının kritik dəyərlərini müəyyən etmək üçün Cədvəldən istifadə edirik. Tətbiqlər 2. Əhəmiyyət səviyyəsi üçün a = 0,05 at n =12 qiymət n-ta=9. Buna görə də T> n-ta (10>9) bərabərsizliyi ödənilir. Buna görə də qərar qaydasına uyğun olaraq sıfır fərziyyə 0,05 əhəmiyyətlilik səviyyəsində rədd edilir və alternativ fərziyyə qəbul edilir ki, bu da dərs vəsaitini öz-özünə öyrəndikdən sonra şagirdlərin biliyinin yaxşılaşdığı qənaətinə gəlməyə imkan verir.

Misal 5Ehtimal olunur ki, riyaziyyat kursunun öyrənilməsi şagirdlərdə məntiqi təfəkkür metodlarından birinin (məsələn, ümumiləşdirmə metodunun) formalaşmasına, hətta onun formalaşması məqsədyönlü şəkildə həyata keçirilməsə də, formalaşmasına kömək edir. Bu fərziyyəni yoxlamaq üçün aşağıdakı təcrübə aparıldı.

Şagirdlər VII Sinifə 5 tapşırıq təklif edildi, onların həlli bu düşüncə metodundan istifadəyə əsaslanır. Tələbə 3 və ya daha çox tapşırığa düzgün cavab verərsə, bu texnikaya sahib olduğuna inanılırdı.

Aşağıdakı ölçmə şkalası hazırlanmışdır: 1 və ya 2 tapşırıq düzgün həll edilmişdir - bal "0"; 3 tapşırığı düzgün həll etdi - "1" bal; 4 tapşırığı düzgün həll etdi - "2" bal; 5 tapşırıq düzgün həll edildi - "3" bal.

İş iki dəfə aparılıb: sentyabrın sonu və gələn ilin may ayının sonunda. Bu, 7 müxtəlif məktəbdən təsadüfi seçilmiş 35 eyni şagird tərəfindən yazılmışdır. İşin iki dəfə görülməsinin nəticələri cədvəl şəklində yazılacaq (Cədvəl 5-ə bax).

Təcrübənin məqsədlərinə uyğun olaraq, sıfır fərziyyəni aşağıdakı kimi formalaşdırırıq: H 0 - riyaziyyatın öyrənilməsi öyrənilən təfəkkür metodunun formalaşmasına kömək etmir. Onda alternativ fərziyyə belə görünəcək: H 1 - riyaziyyatın öyrənilməsi bu düşüncə metodunun mənimsənilməsinə kömək edir.

Cədvəl 5

Cədvəldəki məlumatlara görə. 5, statistik göstəricilərin qiyməti T=15 - “+” işarəsi ilə fərqlərin sayı. 35 cütdən 12-də "0" işarəsi var; deməkdir, n=35-12=23.

üçün Əlavə 2-dəki cədvələ uyğun olaraq n =23 və əhəmiyyətlilik səviyyəsi 0,025 olarsa, test statistikasının kritik qiymətini 16-a bərabər tapırıq. Buna görə də T bərabərsizliyi

Buna görə də, qərar qaydasına uyğun olaraq, belə bir nəticəyə gəlmək lazımdır ki, əldə edilmiş nəticələr sıfır fərziyyəni rədd etmək üçün kifayət qədər əsas vermir, yəni riyaziyyatın öyrənilməsinin özlüyündə töhfə vermədiyi ifadəsini rədd etmək üçün kifayət qədər əsaslarımız yoxdur. seçilmiş düşüncə tərzinə yiyələnmək.

6.2.2 χ2 testi (xi-kvadrat)

χ 2 meyarı (xi-kvadrat) iki populyasiyanın obyektlərinin paylanmasını iki ad miqyasında ölçmələr əsasında müqayisə etmək üçün istifadə olunur. müstəqil nümunələri.

Tutaq ki, tədqiq olunan əmlakın vəziyyəti (məsələn, müəyyən tapşırığın yerinə yetirilməsi) hər bir obyekt üçün yalnız iki bir-birini istisna edən kateqoriyaya malik olan adlar şkalasında ölçülür (məsələn: düzgün yerinə yetirildi - səhv edildi). İki nümunəli obyektlərdə tədqiq olunan əmlakın vəziyyətinin ölçülməsinin nəticələrinə görə dörd hücrəli 2X2 cədvəli tərtib edilir. (Cədvəl 6-a bax).

Cədvəl 6

Bu cədvəldə O ij- obyektlərin sayıi-th nümunə düşmüşdürj-öyrənilən əmlakın vəziyyətinə görə-ci kateqoriya;i =1,2nümunələrin sayıdır;j=1,2– kateqoriyaların sayı; N- müşahidələrin ümumi sayı, bərabərdir O 11 + O 12 + O 21 + O 22 və ya n 1 + n 2 .

Sonra 2X2 cədvəlindəki məlumatlar əsasında (Cədvəl 6-a bax) ölçmənin birinci (ikinci) kateqoriyasına düşən birinci və ikinci çoxluq obyektlərinin ehtimallarının bərabərliyi haqqında sıfır fərziyyəni yoxlamaq olar. yoxlanılan əmlakın miqyası, məsələn, nəzarət və eksperimental siniflərdə şagirdlər tərəfindən müəyyən tapşırığı düzgün yerinə yetirmə ehtimallarının bərabərliyi haqqında fərziyyə.

Sıfır fərziyyələri sınaqdan keçirərkən ehtimalların olması lazım deyil səh 1səh 2 məlum idi, çünki fərziyyələr yalnız onlar arasında müəyyən əlaqələr yaradır (bərabərlik, az və ya çox).

Yuxarıda müzakirə edilən sıfır fərziyyələri yoxlamaq üçün 2X2 cədvəlinin məlumatlarına əsasən (Cədvəl 6-a baxın) meyarın statistikasının dəyəri hesablanır. T aşağıdakı ümumi düstura görə:

(9)

burada n 1 , n 2 - nümunə ölçüləri,N=n1 + n2- müşahidələrin ümumi sayı.

Hipotez sınaqdan keçirilir H0: p 1 £ p 2- alternativi ilə H 1: p 1 > p 2. Qoy olsun a - qəbul edilmiş əhəmiyyət səviyyəsi. Sonra statistik dəyəri T, eksperimental məlumatlar əsasında alınan statistikanın kritik qiyməti ilə müqayisə edilir x 1-2 a ,cədvəllə müəyyən edilir c 2 c seçilmiş dəyəri nəzərə alaraq bir sərbəstlik dərəcəsi (bax. Əlavə 2). a . Əgər bərabərsizlik doğrudursa T< x 1-2 a , onda sıfır hipotezi səviyyəsində qəbul edilir a .Əgər bu bərabərsizlik təmin edilmirsə, onda bizim sıfır fərziyyəni rədd etmək üçün kifayət qədər əsasımız yoxdur.

Statistikanın dəqiq paylanmasının dəyişdirilməsi ilə əlaqədar T paylanması c 2 c bir sərbəstlik dərəcəsi yalnız böyük nümunələr üçün kifayət qədər yaxşı yaxınlaşma verir, meyarın tətbiqi müəyyən şərtlərlə məhdudlaşdırılır.

1) iki nümunənin həcmlərinin cəmi 20-dən azdır;

2)eksperimental məlumatlardan tərtib edilmiş 2X2 cədvəlində mütləq tezliklərdən ən azı biri 5-dən azdır.

Misal 6Həndəsə tədrisinin məqsədlərinə və proqramın məzmununa uyğun olaraq iki müəllif komandası tərəfindən yazılmış dərsliklərin ən yaxşısını müəyyən etmək məqsədi ilə eksperiment aparılmışdır. IX sinif. Təcrübə üçün təsadüfi seçim yolu ilə iki rayon seçildi, məktəblərin əksəriyyəti kənd yerlərində yerləşirdi. Birinci rayonun (20 sinif) şagirdləri 1 nömrəli, ikinci rayonun (15 sinif) şagirdləri 2 nömrəli dərslik üzrə təhsil alırdılar.

Anketin suallarından birinə iki rayonun eksperimental məktəblərinin müəllimlərinin cavablarının müqayisə üsuluna nəzər salaq: “Dərslik ümumiyyətlə müstəqil oxumaq üçün əlçatandırmı və bu, müəllimin izahat vermədiyi materialı mənimsəməyə kömək edirmi? sinif (Cavab: bəli - yox.)

Müəllimlərin dərsliklərin öyrənilən mülkiyyətinə münasibəti iki kateqoriyaya malik olan adlar şkalasında ölçülür: bəli, yox. Müəllimlərin hər iki nümunəsi təsadüfi və müstəqildir.

Birinci rayonun 20, ikinci rayonun 15 müəlliminin cavablarını iki kateqoriyaya bölüb 2X2 cədvəl şəklində yazacağıq (cədvəl 5).

Cədvəl 7

Cədvəldəki bütün dəyərlər. 7 5-dən az deyil, buna görə də meyardan istifadə şərtlərinə uyğun olaraq c 2 meyarın statistik göstəricilərinin hesablanması (9) düsturu üzrə aparılır.

Əlavə 2-dəki cədvələ uyğun olaraq bir dərəcə azadlıq üçün ( v=l ) və əhəmiyyət səviyyəsi a =0,05 tapın x 1- a a=T kritik = 3.84. Deməli, T bərabərsizliyinin müşahidəsi doğrudur<Т критич (1,86<3,84). Согласно правилу принятия ре­шений для критерия c 2 , əldə edilən nəticə sıfır fərziyyəni rədd etmək üçün kifayət qədər əsas vermir, yəni iki eksperimental rayonda müəllimlər arasında keçirilən sorğunun nəticələri dərsliklərin bərabər mövcudluğu fərziyyəsini rədd etmək üçün kifayət qədər əsas vermir. 1 və tələbələrin müstəqil oxuması üçün 2.

Xi-kvadrat testinin istifadəsi iki populyasiyadan iki nümunənin obyektləri öyrənilən əmlakın vəziyyətinə görə ikidən çox kateqoriyaya bölündüyü halda da mümkündür. Məsələn, eksperimental və nəzarət siniflərində şagirdlər bəzi nəzarət işlərinin yerinə yetirilməsinə görə tələbələrin aldıqları qiymətlərə (bəndlərdə: 2, 3, 4, 5) uyğun olaraq dörd kateqoriyaya bölünürlər.

Hər bir nümunənin obyektlərində tədqiq olunan əmlakın vəziyyətinin ölçülməsinin nəticələri aşağıdakılara bölünür. ilə Kateqoriyalar. Bu məlumatlar əsasında 2XC cədvəli tərtib edilir, burada iki cərgə (nəzərə alınan əhalinin sayına görə) və ilə sütunlar (tədqiqatda qəbul edilmiş öyrənilən əmlakın vəziyyətinin müxtəlif kateqoriyalarının sayına görə).

Cədvəl 8

Cədvəl 8-dəki məlumatlara əsasən, hər birində birinci və ikinci çoxluqların obyektlərinə dəymə ehtimallarının bərabərliyi haqqında sıfır fərziyyəni yoxlamaq mümkündür.mən (i = l,2, ..., C) kateqoriyalar, yəni bütün aşağıdakı bərabərliklərin yerinə yetirilməsini yoxlayın: səh 11 \u003d səh 21, p 12 \u003d p 22, ..., p 1 c \u003d p 2 c. Məsələn, nəzarət və eksperimental siniflərdə şagirdlərin müəyyən tapşırığı yerinə yetirmələri üçün “5”, “4”, “3” və “2” qiymətlərinin alınması ehtimallarının bərabərliyi haqqında fərziyyəni yoxlamaq mümkündür. .

Testdən istifadə edərək sıfır hipotezini yoxlamaq c 2 2XC cədvəlinin məlumatlarına əsasən meyarın statistikasının dəyəri hesablanır T aşağıdakı düstura görə:

(10)

harada səh 1səh 2- nümunə ölçüləri.

Məna T, eksperimental məlumatlar əsasında alınan kritik qiymətlə müqayisə edilir x 1- a ,cədvəllə müəyyən edilir c 2 c k =С-1 sərbəstlik dərəcəsi, seçilmiş əhəmiyyət səviyyəsi nəzərə alınmaqla a . Bərabərsizlik olduqda T> x 1- a asəviyyəsində sıfır hipotezi rədd edilir a və alternativ fərziyyə qəbul edilir. Bu, obyektlərin paylanması deməkdir ilə tədqiq olunan əmlakın vəziyyətinə görə kateqoriyalar nəzərdən keçirilən iki çoxluqda fərqlidir.

Misal 7. Birinci və ikinci rayonların tələbələri tərəfindən kursun bölmələrindən birinin mənimsənilməsini sınaqdan keçirən yazılı işin nəticələrinin müqayisəsi metodologiyasını nəzərdən keçirək.

Təsadüfi seçim yolu ilə əsəri yazan birinci rayonun şagirdlərindən 50 nəfər, ikinci bölgənin şagirdlərindən isə 50 nəfərdən ibarət nümunə seçilmişdir. Xüsusi hazırlanmış fəaliyyətin qiymətləndirilməsi meyarlarına uyğun olaraq, hər bir tələbə dörd kateqoriyadan birinə düşə bilər: pis, orta, yaxşı, əla. 1 nömrəli dərsliyin kursun yoxlanılan hissəsinin daha yaxşı mənimsənilməsinə töhfə verdiyi, yəni birinci eksperimental bölgədəki tələbələrin orta hesabla daha yüksək nəticə alacağı fərziyyəsini yoxlamaq üçün iki tələbə nümunəsi tərəfindən görülən işin nəticələrindən istifadə edirik. ikinci bölgədəki tələbələrdən daha çox qiymətlər.

Hər iki nümunənin tələbələrinin gördüyü işlərin nəticələrini 2X4 cədvəl şəklində yazacağıq (Cədvəl 9 ).

Cədvəl 9

Meyardan istifadə şərtlərinə uyğun olaraq c 2 kriteriya statistikası düzəldilmiş düstura (10) uyğun olaraq hesablanır.

Əlavə 2-dəki cədvələ uyğun olaraq iki quyruqlu xi-kvadrat testinin tətbiqi şərtlərinə uyğun olaraq bir dərəcə azadlıq üçün ( k Qrabar M.İ., Krasnyanskaya K.A. Pedaqoji tədqiqatlarda riyazi statistikanın tətbiqi. Parametrik olmayan üsullar. M., Pedaqogika, 1977, s.54

Qrabar M.İ., Krasnyanskaya K.A. Pedaqoji tədqiqatlarda riyazi statistikanın tətbiqi. Parametrik olmayan üsullar. M., “Pedaqogika”, 1977, s.57

Statistik test

R 0 hipotezinin rədd edilməsi və ya qəbul edilməsi qaydası adlanır statistik meyar. Kriteriyanın adı, bir qayda olaraq, meyarda hesablanmış statistik fərziyyənin yoxlanılması alqoritminin 2-ci bəndindən (bax. bənd 4.1) xüsusi tərtib edilmiş xarakteristikanı ifadə edən hərfdən ibarətdir. Bu alqoritmin şərtləri altında kriteriya çağırılacaqdır "in-meyar".

Statistik fərziyyələri sınaqdan keçirərkən iki növ səhv mümkündür:

  • - birinci növ səhv(həqiqətən doğru olduqda I 0 hipotezini rədd edə bilərsiniz);
  • - II tip səhv(Fərziyyə I 0, əslində doğru olmadıqda qəbul edə bilərsiniz).

Ehtimal a bir tip səhv etmək adlanır kriteriyanın əhəmiyyətlilik səviyyəsi.

Əgər üçün R II tip xəta etmək ehtimalını ifadə edin, sonra (l - R) - adlanan II tip xətanın edilməməsi ehtimalı meyarın gücü.

Uyğunluq x 2 Pearson

Statistik fərziyyələrin bir neçə növü var:

  • - paylanma qanunu haqqında;
  • - nümunələrin homojenliyi;
  • - paylama parametrlərinin ədədi dəyərləri və s.

Biz paylanma qanunu ilə bağlı fərziyyəni Pearson x 2 uyğunluq testinin nümunəsində nəzərdən keçirəcəyik.

Uyğunluq meyarı naməlum paylanmanın iddia edilən qanunu haqqında sıfır fərziyyəni yoxlamaq üçün statistik test adlanır.

Pirsonun uyğunluq testi müəyyən paylanma qanununun fərziyyəsi əsasında hesablanmış müşahidələrin empirik (müşahidə edilmiş) və nəzəri tezliklərinin müqayisəsinə əsaslanır. Burada №0 fərziyyə aşağıdakı kimi tərtib edilmişdir: ümumi əhali tədqiq olunan meyara görə normal olaraq paylanmışdır.

Meyarlar üçün Statistik Fərziyyə Sınaq Alqoritmi #0 x 1 Pearson:

  • 1) biz R 0 hipotezini irəli sürdük - tədqiq olunan meyara görə, ümumi əhali normal şəkildə paylanır;
  • 2) seçmə orta və standart kənarlaşmanı hesablayın haqqında in;

3) mövcud nümunə həcminə görə P biz xüsusi tərtib edilmiş xarakteristika hesablayırıq,

burada: i, - empirik tezliklər, - nəzəri tezliklər,

P - nümunə ölçüsü,

h- intervalın dəyəri (iki bitişik seçim arasındakı fərq),

Müşahidə olunan xüsusiyyətin normallaşdırılmış dəyərləri,

- masa funksiyası. Həmçinin nəzəri tezliklər

düstura uyğun olaraq standart MS Excel NORMDIST funksiyasından istifadə etməklə hesablana bilər;

4) seçmə paylanmasına görə, biz xüsusi tərtib edilmiş xarakteristikanın kritik qiymətini təyin edirik XL P

5) 0 nömrəli hipotez rədd edildikdə, 0 nömrəli hipotez qəbul edildikdə.

Misal.İşarəni nəzərə alın X- islah koloniyalarından birində məhkumlar üçün variasiya seriyası kimi təqdim olunan bəzi psixoloji xüsusiyyətlərə görə sınaq göstəricilərinin dəyəri:

0,05 əhəmiyyətlilik səviyyəsində ümumi əhalinin normal paylanması fərziyyəsini yoxlayın.

1. Empirik paylanmaya əsaslanaraq, fərziyyə irəli sürmək olar H 0: tədqiq olunan meyara görə "bu psixoloji xüsusiyyət üçün test göstəricisinin dəyəri", ümumi əhali

uşaqların sayı normal olaraq paylanır. Alternativ fərziyyə 1: tədqiq olunan “bu psixoloji xüsusiyyət üçün test göstəricisinin dəyəri” xüsusiyyətinə əsasən, məhkumların ümumi əhalisi normal şəkildə bölüşdürülmür.

2. Ədədi nümunə xarakteristikalarını hesablayın:

Intervallar

x y y

X) sch

3. Xüsusi tərtib edilmiş xarakteristikanı hesablayın j 2 . Bunu etmək üçün əvvəlki cədvəlin sondan əvvəlki sütununda düsturdan istifadə edərək nəzəri tezlikləri tapırıq və sonuncu sütunda

xarakteristikasını hesablayaq % 2 . alırıq x 2 = 0,185.

Aydınlıq üçün biz empirik paylanmanın çoxbucaqlısını və nəzəri tezliklər üçün normal əyrini qururuq (şək. 6).

düyü. 6.

4. Sərbəstlik dərəcələrinin sayını təyin edin s: k = 5, t = 2, s = 5-2-1 = 2.

Cədvələ görə və ya standart MS Excel funksiyasından istifadə edərək "XI20BR" sərbəstlik dərəcələrinin sayı 5 = 2 və əhəmiyyət səviyyəsi a = 0,05 kriteriyanın kritik qiymətini tapın xl P.=5,99. Əhəmiyyət səviyyəsinə görə a= 0,01 kriteriyanın kritik qiyməti X%. = 9,2.

5. Kriteriyanın müşahidə edilən dəyəri X=0,185 tapılan bütün dəyərlərdən azdır Hc R.-> buna görə də R 0 hipotezi hər iki əhəmiyyətlilik səviyyəsində qəbul edilir. Empirik və nəzəri tezliklər arasındakı uyğunsuzluq əhəmiyyətsizdir. Buna görə də müşahidə məlumatları əhalinin normal paylanması fərziyyəsinə uyğundur. Belə ki, tədqiq olunan “bu psixoloji əlamət üzrə test göstəricisinin dəyəri” xüsusiyyətinə əsasən, məhkumların ümumi əhalisi normal şəkildə bölüşdürülür.

  • 1. Koryaçko A.V., Kuliçenko A.G. Psixologiyada ali riyaziyyat və riyazi metodlar: psixologiya fakültəsinin tələbələri üçün praktiki məşğələlər üçün bələdçi. Ryazan, 1994.
  • 2. Nəslədov A.D. Psixoloji tədqiqatın riyazi üsulları. Məlumatların təhlili və şərhi: Dərslik, dərslik. SPb., 2008.
  • 3. Sidorenko E.V. Psixologiyada riyazi emal üsulları. SPb., 2010.
  • 4. Soshnikova L.A. və başqaları İqtisadiyyatda çoxvariantlı statistik təhlil: Dərslik, universitetlər üçün dərslik. M., 1999.
  • 5. Sukhodolsky E.V. Psixologiyada riyazi metodlar. Xarkov, 2004.
  • 6. Şmoylova R.A., Minaşkin V.E., Sadovnikova N.A. Statistika nəzəriyyəsi üzrə seminar: Dərslik, dərs vəsaiti. M., 2009.
  • Gmurman V.E. Ehtimal nəzəriyyəsi və riyazi statistika. S. 465.
Əlaqə