Βαθμολογία Ακρίβειας (Accuracy Score)

Τι είναι το Accuracy Score (Βαθμολογία Ακρίβειας);

Στη Μηχανική Μάθηση (Machine Learning), το Accuracy Score (Βαθμολογία Ακρίβειας) είναι μια μετρική αξιολόγησης που υπολογίζει το ποσοστό των σωστών προβλέψεων ενός μοντέλου σε σχέση με το συνολικό αριθμό των δειγμάτων. Ουσιαστικά, απαντά στο ερώτημα: "Πόσο συχνά είναι σωστό το μοντέλο;". Αποτελεί τον πιο διαισθητικό δείκτη απόδοσης, αλλά είναι πιο αξιόπιστος όταν χρησιμοποιείται σε Ισορροπημένα Σύνολα Δεδομένων (Balanced Datasets), όπου οι κλάσεις έχουν παρόμοιο αριθμό παρατηρήσεων.

Ποιος είναι ο τύπος υπολογισμού του Accuracy Score;

Ο υπολογισμός βασίζεται στα στοιχεία του Πίνακα Σύγχυσης (Confusion Matrix). Για να βρείτε το σκορ, αθροίζετε όλες τις σωστές προβλέψεις —τα Αληθώς Θετικά (True Positives) και τα Αληθώς Αρνητικά (True Negatives)— και διαιρείτε το αποτέλεσμα με το συνολικό αριθμό των παρατηρήσεων.

Ποια είναι η διαφορά μεταξύ Accuracy (Ακρίβεια) και Precision (Πιστότητα);

Αν και συχνά συγχέονται, μετρούν διαφορετικά πράγματα. Το Accuracy (Ακρίβεια) μετρά τη γενική ορθότητα του μοντέλου (πόσα βρήκαμε σωστά από το σύνολο των δεδομένων). Αντίθετα, το Precision (Πιστότητα) εστιάζει αποκλειστικά στην ποιότητα των θετικών προβλέψεων: "Από όλες τις φορές που το μοντέλο προέβλεψε 'Θετικό', πόσες φορές είχε δίκιο;". Το Precision είναι κρισιμότερο όταν το κόστος ενός Ψευδώς Θετικού (False Positive) είναι υψηλό (π.χ. antispam φίλτρα).

Πότε το Accuracy Score θεωρείται παραπλανητικό;

Η μετρική αυτή αποτυγχάνει σε Ανισορροπημένα Σύνολα Δεδομένων (Imbalanced Datasets). Για παράδειγμα, σε ένα σενάριο ανίχνευσης σπάνιας ασθένειας όπου μόνο το 1% του πληθυσμού νοσεί, ένα μοντέλο που προβλέπει τυφλά "Υγιής" για όλους θα πετύχει 99% Accuracy Score (Βαθμολογία Ακρίβειας). Ωστόσο, το μοντέλο αυτό είναι πρακτικά άχρηστο, καθώς δεν εντοπίζει κανένα πραγματικό κρούσμα. Σε τέτοιες περιπτώσεις, είναι προτιμότερο να χρησιμοποιείτε το Recall (Ανάκληση) ή το F1-Score.