Maraqlıdır

Statistikada korrelyasiya nədir?

Statistikada korrelyasiya nədir?

Bəzən ədədi məlumatlar cüt olur. Bəlkə də bir paleontoloq eyni dinozavr növünün beş fosilində femur (bacak sümüyü) və humerusun (qol sümüyünün) uzunluqlarını ölçür. Qolun uzunluğunu bacak uzunluğundan ayrı düşünmək və orta və ya standart sapma kimi şeyləri hesablamaq mənada ola bilər. Bəs tədqiqatçı bu iki ölçü arasında bir əlaqənin olub olmadığını bilmək istəyi ilə maraqlanırsa nə etməli? Qollara yalnız ayaqlardan ayrı baxmaq kifayət deyil. Bunun əvəzinə, paleontoloq hər skelet üçün sümüklərin uzunluğunu cütləşdirməli və korrelyasiya kimi tanınan statistika sahəsindən istifadə etməlidir.

Korrelyasiya nədir? Yuxarıdakı nümunədə tədqiqatçının məlumatları araşdıraraq, daha uzun qolları olan dinozavr fosillərinin daha uzun ayaqları, daha qısa qolları olan fosillərin isə daha qısa ayaqları olması təəccüblü nəticəyə gəldiyini güman edin. Məlumatların dağınıq bir nöqtəsi göstərdi ki, məlumat nöqtələri hamısı düz bir xəttin yaxınlığında yığılmışdı. Tədqiqatçı sonra güclü bir düz xətt əlaqəsinin olduğunu söylədi və ya korrelyasiya, fosillərin qol sümükləri və bacak sümükləri arasında. Bu əlaqənin nə qədər güclü olduğunu söyləmək üçün bir az daha çox iş tələb olunur.

Korrelyasiya və dağınıq yerlər

Hər bir məlumat nöqtəsi iki nömrəni təmsil etdiyindən, iki ölçülü bir skatterplot məlumatların vizual göstərilməsində böyük köməkdir. Tutaq ki, həqiqətən dinozavr məlumatlarında əlimiz var və beş fosil aşağıdakı ölçülərə malikdir:

  1. Femur 50 sm, humerus 41 sm
  2. Femur 57 sm, humerus 61 sm
  3. Femur 61 sm, humerus 71 sm
  4. Femur 66 sm, humerus 70 sm
  5. Femur 75 sm, humerus 82 sm

Üfüqi istiqamətdə femur ölçüsü və şaquli istiqamətdə humerus ölçülməsi ilə məlumatların bir dağınıq yeri yuxarıdakı qrafiklə nəticələnir. Hər bir nöqtə skeletlərdən birinin ölçmələrini təmsil edir. Məsələn, sol altındakı nöqtə 1 nömrəli skeletə uyğundur. Üst sağdakı nöqtə # 5 skeletdir.

Əlbətdə görünür ki, bütün nöqtələrə çox yaxın olan düz bir xətt çəkə bilərik. Ancaq müəyyən bir şey üçün necə deyə bilərik? Yaxınlıq baxıcının nəzərindədir. "Yaxınlıq" anlayışlarımızın başqası ilə uyğun olduğunu necə bilirik? Bu yaxınlığı ölçə biləcəyimiz bir yol varmı?

Korrelyasiya əmsalı

Məlumatların düz bir xətt boyunca nə qədər yaxın olduğunu obyektiv ölçmək üçün korrelyasiya əmsalı qurtarmağa gəlir. Adətən işarələnən korrelyasiya əmsalı r, -1 ilə 1 arasındakı həqiqi bir rəqəmdir r Prosesdəki hər hansı bir subyektivliyi ortadan qaldıraraq bir düstura əsaslanaraq bir əlaqənin gücünü ölçür. Dəyərini şərh edərkən yadda saxlamaq üçün bir neçə qaydalar var r.

  • Əgər r = 0 sonra nöqtələr, məlumatlar arasında heç bir düz xətt əlaqəsi olmayan tam bir dolaşıqdır.
  • Əgər r = -1 və ya r = 1 sonra bütün məlumat nöqtələri mükəmməl bir xətt üzrə düzülür.
  • Əgər r bu həddindən artıq bir dəyərdirsə, nəticə düz bir xəttin mükəmməl uyğunluğundan azdır. Gerçək dünyadakı məlumat dəstlərində bu ən çox görülən nəticədir.
  • Əgər r müsbətdirsə, xətt müsbət bir yamac ilə davam edir. Əgər r mənfi olduqda xətt mənfi yamac ilə enir.

Korrelyasiya əmsalı hesablanması

Korrelyasiya əmsalı üçün düstur r burada göründüyü kimi mürəkkəbdir. Düsturun maddələri həm rəqəmsal məlumatların həm də dəst nöqtələrinin, həm də məlumat nöqtələrinin sayının vasitələri və standart sapmasıdır. Ən praktik tətbiqlər üçün r əl ilə hesablamaq üçün yorucu. Məlumatlarımız statistik əmrlərlə bir kalkulyatora və ya elektron tablo proqramına daxil edilmişdirsə, hesablamaq üçün ümumiyyətlə quraşdırılmış bir funksiya mövcuddur r.

Münasibət məhdudiyyətləri

Korrelyasiya güclü bir vasitə olsa da, istifadəsində bəzi məhdudiyyətlər var:

  • Korrelyasiya bizə məlumat barədə hər şeyi tam izah etmir. Vasitələr və standart sapmalar vacib olmağa davam edir.
  • Verilənlər düz bir xəttdən daha mürəkkəb bir əyri ilə təsvir edilə bilər, lakin bu hesablamada göstərilməyəcəkdir r.
  • Xarici məhsullar korrelyasiya əmsalına güclü təsir göstərir. Verilənlərimizdə hər hansı bir çarəni görsək, dəyərindən hansı nəticələrə gəldiyimizə diqqət yetirməliyik r.
  • İki məlumat dəsti bir-biri ilə əlaqəli olduğundan, o biri digərinin səbəbi olduğunu bildirmir.

 

Videoya baxın: Statistika-1 - və Çebışev qanunauyğunluqları,Kovariasiya və Korrelyasiya (Aprel 2020).