Hypothesis Testing

Τι είναι το Hypothesis Testing;

Μια διαδικασία για να προσδιοριστεί εάν μια υπόθεση είναι στατιστικά σημαντική. Περιλαμβάνει τη σύγκριση μιας βασικής υπόθεσης σχετικά με έναν πληθυσμό με παρατηρούμενα δεδομένα δείγματος. Το αποτέλεσμα υπαγορεύει εάν η αρχική υπόθεση πρέπει να απορριφθεί υπέρ μιας εναλλακτικής υπόθεσης που βασίζεται σε ένα αυστηρό, προκαθορισμένο όριο πιθανότητας.

 

Τι είναι το Null Hypothesis και το Alternative Hypothesis;

Το Null Hypothesis είναι η προεπιλεγμένη δήλωση που δηλώνει ότι δεν υπάρχει σχέση, καμία διαφορά ή καμία επίδραση μεταξύ ομάδων ή μεταβλητών σε ένα σύνολο δεδομένων. Το Alternative Hypothesis είναι η αντίθετη δήλωση που δηλώνει ότι υπάρχει μια συγκεκριμένη σχέση ή διαφορά. Η διαδικασία ελέγχου αξιολογεί μαθηματικά τα δεδομένα για να προσδιορίσει εάν υπάρχουν αρκετά στοιχεία για να απορριφθεί η Μηδενική Υπόθεση.

 

Τι είναι η τιμή p και πώς καθορίζει το αποτέλεσμα;

Η τιμή p είναι μια υπολογισμένη πιθανότητα. Αντιπροσωπεύει την πιθανότητα λήψης των παρατηρούμενων δεδομένων δείγματος εάν το Null Hypothesis είναι απολύτως αληθής. Ο αξιολογητής συγκρίνει αυτήν την τιμή p με ένα προκαθορισμένο επίπεδο σημαντικότητας. Εάν η τιμή p είναι χαμηλότερη από αυτό το επίπεδο, το αποτέλεσμα θεωρείται στατιστικά σημαντικό, γεγονός που οδηγεί στην απόρριψη της Μηδενικής Υπόθεσης.

 

Ποια είναι τα τελικά συμπεράσματα αυτής της διαδικασίας δοκιμών;

Υπάρχουν ακριβώς δύο πιθανά αποτελέσματα: η απόρριψη του Null Hypothesis ή η μη απόρριψη του Null Hypothesis.

Η απόρριψή της υπονοεί ότι τα δεδομένα του δείγματος παρέχουν επαρκή στατιστικά στοιχεία για να υποστηρίξουν το Alternative Hypothesis.

Η μη απόρριψή της σημαίνει ότι τα δεδομένα δεν διαθέτουν επαρκή στοιχεία για να υποστηρίξουν το Alternative Hypothesis. Ωστόσο, δεν αποδεικνύει οριστικά ότι το Null Hypothesis είναι αληθής.

 

Σε ποιες γλώσσες προγραμματισμού εφαρμόζεται το Hypothesis Testing

Ο έλεγχος υποθέσεων εκτελείται τυπικά χρησιμοποιώντας γλώσσες στατιστικού προγραμματισμού, κυρίως R και Python. Στην Python, βιβλιοθήκες όπως το scipy.stats και το statsmodels παρέχουν συγκεκριμένες ενσωματωμένες συναρτήσεις για τη διεξαγωγή αυτών των δοκιμών. Αυτές οι βιβλιοθήκες υπολογίζουν αυτόματα τα απαιτούμενα στατιστικά στοιχεία δοκιμών και τις τιμές p απευθείας από τα παρεχόμενα σύνολα δεδομένων, εξαλείφοντας την ανάγκη για χειροκίνητο μαθηματικό υπολογισμό.

 

Eνα πρακτικό παράδειγμα επιστήμης δεδομένων για τη χρήση του Hypothesis Testing

Σε ένα έργο επιστήμης δεδομένων που αναλύει την επισκεψιμότητα ιστοσελίδων ηλεκτρονικού εμπορίου, ένας προγραμματιστής χρησιμοποιεί A/B testing για να αξιολογήσει μια νέα σχεδίαση σελίδας ολοκλήρωσης αγοράς. Το Null Hypothesis δηλώνει ότι ο νέος σχεδιασμός δεν έχει καμία επίδραση στο ποσοστό μετατροπών των χρηστών σε σύγκριση με τον παλιό σχεδιασμό. Ο προγραμματιστής συλλέγει δεδομένα αγοράς από τις συνεδρίες χρηστών και για τις δύο εκδόσεις σελίδας και χρησιμοποιεί τη βιβλιοθήκη scipy στην Python για να εκτελέσει μια στατιστική δοκιμή. Εάν η προκύπτουσα τιμή p είναι κάτω από το καθορισμένο επίπεδο σημαντικότητας, ο προγραμματιστής καταλήγει στο συμπέρασμα ότι ο νέος σχεδιασμός προκαλεί μια στατιστικά σημαντική διαφορά στα ποσοστά μετατροπών και εγκρίνει τη μόνιμη ανάπτυξη της νέας σελίδας.