Περιγραφική Στατιστική: Ορισμός, Είδη και Παραδείγματα (2023)
Στη σημερινή εποχή με τον μεγάλο όγκο δεδομένων που υπάρχουν, υπάρχει μια διαρκής ανάγκη για την συλλογή και την ανάλυση των δεδομένων αυτών, με σκοπό την εξαγωγή συμπερασμάτων.
Υπάρχουν πολλές μέθοδοι συλλογής δεδομένων, ενώ συνάμα είναι ιδιαίτερα σημαντικό να εξασφαλίζεται η ποιότητα των δεδομένων που αναλύονται για να αποφεύγονται τυχόν σφάλματα.
Ο όρος της περιγραφικής στατιστικής είναι ιδιαίτερα γνώριμος σε τομείς που υπάρχει μεγάλη ποσότητα δεδομένων όπως στον τομέα των επιχειρήσεων, σε τομείς της έρευνας, αλλά ακόμη και στο καθημερινό σχολικό περιβάλλον.
Σε αυτό λοιπόν το άρθρο θα δούμε:
Τι είναι η περιγραφική στατιστική και γιατί είναι σημαντική
Παραδείγματα της περιγραφικής στατιστικής
Είδη της περιγραφικής στατιστικής
Ας ξεκινήσουμε με ένα βασικό ορισμό.
Τι Είναι η Περιγραφική Στατιστική
Η περιγραφική στατιστική (Descriptive Statistics) αποτελεί κλάδο της στατιστικής και αναφέρεται στην ανάλυση, περίληψη και παρουσίαση ευρημάτων που σχετίζονται με ένα σύνολο δεδομένων.
Τα δεδομένα αυτά μπορεί να προέρχονται από ένα δείγμα ή ολόκληρο το σύνολο των δεδομένων.
Ωστόσο, η περιγραφική στατιστική δεν περιλαμβάνει θεωρίες, πιθανότητες ή συμπεράσματα. Με αυτά ασχολείται ένας άλλος, ξεχωριστός κλάδος της στατιστικής, η επαγωγική στατιστική (Inferential Statistics).
Βασικός σκοπός της περιγραφικής στατιστικής είναι να μεταφέρει πληροφορίες για ένα μεγάλο όγκο δεδομένων.
Έτσι λοιπόν, η περιγραφική στατιστική συμβάλλει στη διευκόλυνση της οπτικοποίησης των δεδομένων (data visualization), καθώς ένα από τα βασικά πλεονεκτήματά της είναι ότι δίνει τη δυνατότητα να αναπαριστώνται τα δεδομένα με κατανοητό τρόπο, το οποίο εν τέλει επιτρέπει την πιο απλή ερμηνεία των δεδομένων.
Αφού είδαμε τι είναι η περιγραφική στατιστική και γιατί είναι σημαντική, ας συνεχίσουμε με μερικά πρακτικά παραδείγματα για καλύτερη και πιο ενδελεχή κατανόηση.
Παραδείγματα Περιγραφικής Στατιστικής
Υπάρχει μια πληθώρα από παραδείγματα περιγραφικής στατιστικής που συναντάμε στην καθημερινότητα, αλλά και σε επιστημονικούς και ερευνητικούς κλάδους.
Αρχικά, οι data scientists και data analysts με διάφορες γνώσεις και δεξιότητες όπως είναι η Python, χρησιμοποιούν ιδιαίτερα την περιγραφική στατιστική για την διευκόλυνση της εργασίας τους με μεγάλο όγκο δεδομένων.
Ακόμη, στο χώρο των επιχειρήσεων ο μέσος αριθμός εσόδων ανά πελάτη, ο αριθμός των πελατών σε διαφορετικές ηλικιακές ομάδες και η αναλογία των διαφημιστικών δαπανών και των εσόδων από πωλήσεις μπορεί να παρέχει πληροφορίες που μπορούν να χρησιμοποιηθούν για τις στρατηγικές μάρκετινγκ σε μια επιχείρηση.
Επιπρόσθετα, ένα απλό παράδειγμα, με το οποίο όλοι είμαστε οικείοι, είναι ο μέσος όρος του βαθμού που παίρνουν οι μαθητές στα σχολικά μαθήματα.
Ο μέσος όρος δεν οδηγεί σε κάποια μελλοντική πρόβλεψη με βάση κάποιο μοτίβο.
Αυτό που κάνει είναι να περιγράψει τα δεδομένα, παρέχοντας μια περίληψη της σχολικής επίδοσης των μαθητών.
Τα δεδομένα που συλλέγονται και λαμβάνεται ο μέσος όρος τους είναι για παράδειγμα οι βαθμοί στις εξετάσεις και τα διάφορα projects κατά τη διάρκεια της σχολικής χρονιάς.
Συνεχίζοντας, η απογραφή πληθυσμού αποτελεί ένα ακόμα γνωστό παράδειγμα, όπου η περιγραφική στατιστική χρησιμοποιείται για την αναλογία ανδρών και γυναικών όπως και για τη μέση ηλικία των ανθρώπων σε κάποια χώρα.
Ωστόσο, η περιγραφική στατιστική έχει μεγάλη σημασία και συμβολή ακόμη και στο χώρο του αθλητισμού. Πληροφορίες και στατιστικά δεδομένα όπως το ποσοστό ευστοχίας ανά παίκτη σε κάποιον αγώνα μπάσκετ, για παράδειγμα, μπορούν να απεικονιστούν σε μορφή πίνακα και γραφήματος, με τη βοήθεια της περιγραφικής στατιστικής.
3 Είδη Περιγραφικής Στατιστικής
Η περιγραφική στατιστική περιλαμβάνει τρεις κύριες κατηγορίες- είδη.
Ας τις δούμε αναλυτικά ακολούθως.
Είδος #1: Κατανομή Συχνοτήτων
Η κατανομή συχνοτήτων χρησιμοποιείται τόσο για ποσοτικά όσο και για ποιοτικά δεδομένα και απεικονίζει τη συχνότητα ή τον αριθμό των διαφορετικών αποτελεσμάτων σε ένα σύνολο δεδομένων ή σε ένα δείγμα.
Η κατανομή συχνοτήτων παρουσιάζεται συνήθως σε μορφή πίνακα ή γραφήματος όπως για παράδειγμα το ραβδόγραμμα και το ιστόγραμμα.
Κάθε καταχώρηση στον πίνακα ή στο γράφημα συνοδεύεται από το πλήθος ή τη συχνότητα εμφάνισης των τιμών.
Με αυτό το τρόπο επιτυγχάνεται μια πιο δομημένη παρουσίαση των ανεπεξέργαστων δεδομένων (raw data).
Είδος #2: Μέτρα Κεντρικής Τάσης
Τα μέτρα κεντρικής τάσης, γνωστά και ως μέτρα κεντρικής θέσης, υπολογίζουν το μέσο όρο ή τις μέσες τιμές ενός συνόλου δεδομένων.
Οι μέθοδοι που χρησιμοποιούνται είναι ο μέσος όρος, η διάμεση τιμή και η επικρατούσα τιμή.
Ο μέσος όρος (mean), το πιο δημοφιλές μέτρο της κεντρικής τάσης, είναι η μέση τιμή σε ένα σύνολο δεδομένων.
Η διάμεση τιμή (median) αναφέρεται στη μεσαία τιμή για ένα σύνολο δεδομένων σε αύξουσα σειρά.
Η επικρατούσα τιμή ή κορυφή (mode) αναφέρεται στη βαθμολογία ή την τιμή που είναι πιο συχνή σε ένα σύνολο από δεδομένα.
Η επικρατούσα τιμή μπορεί να οριστεί και στην περίπτωση που έχουμε ποιοτικά δεδομένα, ενώ τα άλλα μέτρα ορίζονται μόνο για ποσοτικά δεδομένα.
Είδος #3: Μέτρα Μεταβλητότητας
Τα μέτρα μεταβλητότητας ή αλλιώς μέτρα διασποράς χρησιμοποιούνται για την απεικόνιση του πόσο διασκορπισμένη είναι η κατανομή σε ένα δείγμα ή σε ένα σύνολο δεδομένων.
Στη συγκεκριμένη κατηγορία περιγραφικής στατιστικής για την απεικόνιση διαφορετικών στοιχείων και πτυχών της εξάπλωσης, χρησιμοποιούνται 3 μέτρα: το εύρος, η τυπική απόκλιση και η διακύμανση.
Το εύρος απεικονίζει τον βαθμό διασποράς, ορίζοντας το πόσο απέχουν οι ακραίες τιμές.
Η τυπική απόκλιση χρησιμοποιείται για να προσδιορίσει τη μέση διακύμανση σε ένα σύνολο δεδομένων.
Η διακύμανση είναι ένας μέσος όρος των τετραγωνισμένων αποκλίσεων.
Με Λίγα Λόγια
Είδαμε λοιπόν τι είναι η περιγραφική στατιστική και γιατί είναι σημαντική, τα είδη της καθώς και κάποια παραδείγματα.
Το επάγγελμα του Data Analyst που προαναφέραμε είναι ιδιαίτερα ανερχόμενο και κερδοφόρο στις μέρες μας.
Για τον λόγο αυτό, η ανάλυση και η ορθή περιγραφή των δεδομένων, είναι ένα από τα πολλά πράγματα που διδάσκουμε εδώ στη BigBlue.
Αν τα ενδιαφέροντά σου σχετίζονται με όσα προαναφέραμε, ανακάλυψε το Data Analytics Bootcamp και ξεκίνα δυναμικά τη καριέρα σου!