Chi-square
Δείκτης χι (στο) τετράγωνο. Τσοπάνογλου 20102:78, 137.
Ο δείκτης χι στο τετράγωνο θεωρείται δείκτης συνάφειας, αλλά και στατιστικό τεστ (chi-square test) ή «κατανομή», επειδή μπορεί να υπολογιστεί ακόμη και με δεδομένα που αφορούν μία μόνο μεταβλητή και μία μόνο μέτρηση. Σε αντίθεση με τους άλλους δείκτες συνάφειας, που μπορούν να πάρουν τιμή από 0 ως 1 και έχουν θετικό ή αρνητικό σύμβολο για να φανεί η «κατεύθυνση» της συνάφειας, αυτός μπορεί να πάρει θεωρητικά οποιαδήποτε τιμή. Σωστό, όμως, είναι να εξετάζεται ως ιδιότυπος δείκτης συνάφειας, επειδή, ακόμη και όταν προκύπτει από ένα μοναδικό σύνολο δεδομένων, δείχνει σχέση: τη σχέση που υπάρχει ανάμεσα στην παρατηρηθείσα ή παρατηρούμενη συχνότητα (observed frequency) και στην αναμενόμενη ή προβλεπόμενη συχνότητα (expected frequency).
Η παρατηρηθείσα συχνότητα είναι ο αριθμός των φορών εμφάνισης της τιμής μιας μεταβλητής, δηλαδή μιας βαθμίδας της υιοθετούμενης κλίμακας. Αν, για παράδειγμα, μελετάει κανείς το μαθητικό πληθυσμό μιας σχολικής μονάδας ως προς τη μεταβλητή φύλο, αυτή έχει δύο τιμές. Αν ο μαθητικός πληθυσμός θηλυκού γένους αποτελείται από 232 άτομα, τότε η παρατηρηθείσα συχνότητα σε αυτή τη βαθμίδα της κλίμακας είναι 232, και αν τα αγόρια είναι 366, τότε το 366 είναι η παρατηρηθείσα συχνότητα σε αυτή τη βαθμίδα της κλίμακας (Τσοπάνογλου 20102:138).
Η παρατηρηθείσα συχνότητα συμβολίζεται με το σύμβολο fο ή το O(i), ενώ η αναμενόμενη με το fe ή το E(i).
Ο υπολογισμός της fe για κάθε βαθμίδα μπορεί να γίνει ορθολογικά σκεπτόμενοι. Στο παράδειγμά μας, γνωρίζοντας ότι ο αριθμός των ανδρών και των γυναικών είναι περίπου ίσος, θα περιμέναμε το 50% των μαθητών να ανήκει στη μία βαθμίδα και το άλλο 50% στην άλλη. Αφού ο συνολικός πληθυσμός του σχολείου είναι 232 + 366 = 598, τότε θα περιμέναμε να υπάρχουν 299 αγόρια και 299 κορίτσια. Επομένως το 299 είναι η fe κάθε βαθμίδας. Η σύγκριση, με βάση ένα μαθηματικό τύπο, των fο και των fe δίνει ένα νούμερο που ερμηνεύεται με βάση τον πίνακα κριτικών τιμών του χ2.
Αν ο χ2 χρησίμευε μόνο για περιπτώσεις μονομεταβλητής ανάλυσης, δηλαδή στατιστικής ανάλυσης δεδομένων μιας μόνο μεταβλητής, η αξία του θα ήταν περιορισμένη. Όμως χρησιμοποιείται κυρίως για διμεταβλητή ανάλυση, για να κάνει αυτό που κάνει οποιοσδήποτε δείκτης συνάφειας: να δείξει το μέγεθος της σχέσης που υπάρχει μεταξύ δύο μεταβλητών με δεδομένα τα μεγέθη δύο παρατηρήσεων.
Αυτός ο δείκτης συνάφειας είναι επιβεβλημένο να υπολογίζεται κάθε φορά που η μία, τουλάχιστον, από τις μεταβλητές που συσχετίζονται έχει μετρηθεί με ονοματική κλίμακα.
Βιβλιογραφία
- Τσοπάνογλου Α. (20102). Μεθοδολογία της επιστημονικής έρευνας και εφαρμογές της στην αξιολόγηση της γλωσσικής κατάρτιση. Θεσσαλονίκη: Εκδ. Ζήτη.
- Grimm L. G. (1993). Statistical Applications for the Behavioral Sciences. New York: John Wiley & Sons.
- Peers I. S. (1996). Statistical Analysis for Education and Psychology Researchers. London and New York: The Falmer Press.