Logistic Regression
Τι είναι το Logistic Regression;
Το Logistic Regression είναι ένας αλγόριθμος βελτιστοποίησης που χρησιμοποιεί μια λογιστική συνάρτηση στα χαρακτηριστικά εισόδου για να προβλέψει την πιθανότητα της κλάσης ή απευθείας την ετικέτα κλάσης για τη μεταβλητή-στόχο. Στη δεύτερη περίπτωση, η έξοδος αντιπροσωπεύει ένα σύνολο κατηγοριών αντί για συνεχείς τιμές, πράγμα που σημαίνει ότι η λογιστική παλινδρόμηση λειτουργεί εδώ ως τεχνική ταξινόμησης. Μια τυπική περίπτωση χρήσης logistic regression στην επιστήμη δεδομένων είναι η πρόβλεψη της πιθανότητας απώλειας πελατών.
Πώς διαφέρει μαθηματικά το Logistic Regression από το Linear Regression;
- Το Linear Regression προβλέπει μια συνεχή αριθμητική έξοδο (όπως η εκτίμηση μιας θερμοκρασίας ή μιας τιμής) και η έξοδός της μπορεί θεωρητικά να κυμαίνεται από αρνητικό έως θετικό άπειρο.
- Το Logistic Regression, ωστόσο, έχει σχεδιαστεί για να εξάγει μια τιμή πιθανότητας που οριοθετείται αυστηρά μεταξύ 0 και 1. Το επιτυγχάνει αυτό λαμβάνοντας την τυπική γραμμική εξίσωση και περνώντας το αποτέλεσμά της μέσω μιας συγκεκριμένης μη γραμμικής συνάρτησης μετασχηματισμού, καθιστώντας την ρητά κατάλληλη για classification και όχι για συνεχή πρόβλεψη.
Ποιοι είναι οι κύριοι τύποι μοντέλων Logistic Regression;
Ο αλγόριθμος κατηγοριοποιείται σε τρεις τύπους με βάση τη δομή της μεταβλητής-στόχου:
- Binary Logistic Regression: Η μεταβλητή-στόχος έχει ακριβώς δύο αμοιβαία αποκλειόμενα αποτελέσματα (π.χ., πρόβλεψη εάν ένα email είναι "Spam" ή "Not Spam").
- Multinomial Logistic Regression: Η μεταβλητή-στόχος έχει τρία ή περισσότερα πιθανά διακριτά αποτελέσματα χωρίς ποσοτική σημασία ή σειρά (π.χ., πρόβλεψη εάν ένας χρήστης θα κάνει κλικ στη Διαφήμιση Α, τη Διαφήμιση Β ή τη Διαφήμιση Γ).
- Ordinal Logistic Regression: Η μεταβλητή-στόχος έχει τρία ή περισσότερα πιθανά αποτελέσματα που έχουν μια αυστηρή, καθορισμένη ιεραρχία ή κατάταξη (π.χ., πρόβλεψη μιας βαθμολογίας ικανοποίησης πελατών "Κακή", "Μέτρια" ή "Εξαιρετική").