YOLO

Τι είναι το YOLO;

Το YOLO σημαίνει "You Only Look Once". Είναι ένας αλγόριθμος ανίχνευσης αντικειμένων σε πραγματικό χρόνο που χρησιμοποιείται στην υπολογιστική όραση. Έχει σχεδιαστεί για να αναγνωρίζει ταυτόχρονα ποια αντικείμενα υπάρχουν σε μια εικόνα και να προσδιορίζει την ακριβή τους θέση μέσα σε αυτήν την εικόνα, κάνοντάς το αυτό σε μία μόνο αξιολόγηση των δεδομένων.

 

Πώς επεξεργάζεται ο αλγόριθμος YOLO μια εικόνα;

Ο αλγόριθμος διαιρεί την εικόνα εισόδου σε ένα πλέγμα. Για κάθε κελί πλέγματος, το μοντέλο προβλέπει οριοθετημένα πλαίσια (ορθογώνια περιγράμματα που σκιαγραφούν ένα αντικείμενο) και υπολογίζει την πιθανότητα μια συγκεκριμένη κατηγορία αντικειμένου να ανήκει μέσα σε αυτό το πλαίσιο. Αυτή η διαδικασία βασίζεται στη θεωρητική αρχιτεκτονική των Convolutional Neural Networks (CNN), τα οποία έχουν σχεδιαστεί για να εξάγουν και να επεξεργάζονται οπτικά χαρακτηριστικά απευθείας από δεδομένα pixel.

 

Γιατί το YOLO είναι ταχύτερο από τις παραδοσιακές μεθόδους ανίχνευσης αντικειμένων;

Οι προηγούμενοι αλγόριθμοι ανίχνευσης αντικειμένων απαιτούσαν πολλαπλά βήματα, αξιολογώντας διαφορετικά τμήματα μιας εικόνας διαδοχικά για να βρουν αντικείμενα. Το YOLO επεξεργάζεται ολόκληρη την εικόνα ταυτόχρονα κατά τη διάρκεια ενός μόνο περάσματος από το νευρωνικό του δίκτυο. Αυτή η άμεση προσέγγιση μειώνει δραστικά τον υπολογιστικό χρόνο επεξεργασίας, επιτρέποντας στο YOLO να ανιχνεύει αντικείμενα σε ζωντανές ροές βίντεο σε πραγματικό χρόνο.

 

Ποιες γλώσσες προγραμματισμού και βιβλιοθήκες χρησιμοποιούνται για την υλοποίηση του YOLO;

Το YOLO υλοποιείται κυρίως χρησιμοποιώντας τη γλώσσα προγραμματισμού Python. Οι επιστήμονες δεδομένων και οι μηχανικοί μηχανικής μάθησης εκτελούν μοντέλα YOLO χρησιμοποιώντας βιβλιοθήκες βαθιάς μάθησης, κυρίως το PyTorch. Επιπλέον, η βιβλιοθήκη OpenCV χρησιμοποιείται συχνά σε συνδυασμό με το YOLO για τον χειρισμό των λειτουργιών εισόδου και εξόδου των εικόνων και των αρχείων βίντεο.

 

Ποιοι είναι οι γνωστοί περιορισμοί του YOLO;

Επειδή ο αλγόριθμος βασίζεται σε ένα άκαμπτο σύστημα πλέγματος για την πρόβλεψη πλαισίων οριοθέτησης, δυσκολεύεται να ανιχνεύσει πολύ μικρά αντικείμενα. Επιπλέον, το YOLO δυσκολεύεται να αναγνωρίσει με ακρίβεια αντικείμενα που είναι ομαδοποιημένα πολύ κοντά το ένα στο άλλο, καθώς ένα μόνο κελί πλέγματος περιορίζεται στον αριθμό των διακριτών αντικειμένων που μπορεί να προβλέψει ταυτόχρονα.

 

Πώς χρησιμοποιείται το YOLO σε μια πρακτική εφαρμογή Επιστήμης Δεδομένων;

Κατά την ανάπτυξη αυτόνομων οχημάτων, οι επιστήμονες δεδομένων χρησιμοποιούν το YOLO για να κατασκευάσουν το σύστημα αντίληψης σε πραγματικό χρόνο του οχήματος. Ο αλγόριθμος επεξεργάζεται τη ζωντανή ροή βίντεο από τις εξωτερικές κάμερες του αυτοκινήτου. Σε κλάσματα του δευτερολέπτου, το YOLO αναγνωρίζει και εξάγει τις ακριβείς συντεταγμένες των πεζών, άλλων οχημάτων και των φαναριών, στέλνοντας αυτά τα δομικά δεδομένα στον κεντρικό υπολογιστή του οχήματος για την εκτέλεση ασφαλών εντολών οδήγησης, όπως φρενάρισμα ή τιμόνι.