Cost Function

Τι είναι το Cost Function;

Το Cost Function είναι μια συνάρτηση μηχανικής μάθησης που χρησιμοποιείται για τη μέτρηση του μέσου όρου των διαφορών μεταξύ των προβλεπόμενων και των πραγματικών τιμών στο σύνολο εκπαίδευσης και υποτίθεται ότι είναι ελαχιστοποιημένη. Αξιολογεί τη συνολική απόδοση των τρεχουσών παραμέτρων του μοντέλου (βάρη και μεροληψίες) υπολογίζοντας μια μοναδική βαθμωτή αριθμητική τιμή που αντιπροσωπεύει το συνολικό σφάλμα του μοντέλου σε ολόκληρο το σύνολο δεδομένων.


 

Ποιος είναι ο πρωταρχικός σκοπός της χρήσης ενός Cost Function στη μηχανική μάθηση;

Ο πρωταρχικός σκοπός ενός Cost Function είναι να παρέχει μια αντικειμενική μαθηματική μετρική που ένας αλγόριθμος βελτιστοποίησης, όπως η Gradient Descent μπορεί να ελαχιστοποιήσει. Προσαρμόζοντας επαναληπτικά τις παραμέτρους του μοντέλου για να μειώσει την αριθμητική τιμή εξόδου της Cost Function, το μοντέλο μηχανικής μάθησης μειώνει συστηματικά το ποσοστό σφάλματος και βελτιώνει την προβλεπτική του ακρίβεια.

 

Πώς διαφέρει θεωρητικά ένα Cost Function από ένα Loss Function;

Ενώ οι όροι χρησιμοποιούνται συχνά εναλλακτικά στην πράξη, υπάρχει μια αυστηρή θεωρητική διάκριση στη βιβλιογραφία της μηχανικής μάθησης.

  • Ένα Loss Function , υπολογίζει το σφάλμα για ένα μόνο σημείο δεδομένων εκπαίδευσης.
  • Ένα Cost Function υπολογίζει τον μέσο όρο ή το άθροισμα των μεμονωμένων τιμών ζημιών σε ολόκληρο το σύνολο δεδομένων εκπαίδευσης.

Επομένως, για ένα σύνολο δεδομένων που περιέχει n δείγματα, η Cost Function είναι η μαθηματική συγκέντρωση n διακριτών υπολογισμών ζημιών.

 

Πώς εφαρμόζεται ένα Cost Function κατά την εκπαίδευση ενός μοντέλου στο Linear Regression;

Σε ένα μοντέλο Linear Regression που έχει σχεδιαστεί για να προβλέπει τιμές ακινήτων με βάση τα τετραγωνικά μέτρα των ακινήτων, το μοντέλο αρχικά εκχωρεί τυχαίες τιμές στα βάρη του, δημιουργώντας εξαιρετικά ανακριβείς προβλέψεις τιμών.

Για να αξιολογήσει αυτό, το μοντέλο υπολογίζει το Mean Squared Error (τη Cost Function) λαμβάνοντας τις τετραγωνικές διαφορές μεταξύ των προβλεπόμενων τιμών των ακινήτων και των πραγματικών ιστορικών τιμών που παρέχονται στο σύνολο δεδομένων εκπαίδευσης. Ένας αλγόριθμος βελτιστοποίησης (Gradient Descent) υπολογίζει στη συνέχεια τη μαθηματική παράγωγο (κλίση) αυτής της Cost Function σε σχέση με τα βάρη του μοντέλου. Τα βάρη στη συνέχεια ενημερώνονται προς τη συγκεκριμένη αριθμητική κατεύθυνση που μειώνει την τιμή της Cost Function.

Αυτός ο μαθηματικός κύκλος πρόβλεψης, υπολογισμού του Cost Function και ενημέρωσης βαρών επαναλαμβάνεται επαναληπτικά. Η διαδικασία τερματίζεται όταν το Cost Function φτάσει στην καθολική ελάχιστη τιμή της, υποδεικνύοντας ότι το σφάλμα δεν μπορεί να μειωθεί σημαντικά περαιτέρω. Σε αυτό το ακριβές σημείο, οι παράμετροι του μοντέλου οριστικοποιούνται και το μοντέλο χαρακτηρίζεται ως εκπαιδευμένο.