Ιάσονας Κατέχης: Η Πορεία του ως Machine Learning Researcher

Σήμερα θα γνωρίσουμε τον Ιάσονα Κατέχη, ο οποίος εργάζεται ως Machine Learning Researcher σε εταιρεία της Ολλανδίας και πέρασε με επιτυχία από το Data Science Bootcamp!

Ποια είναι όμως η διαδρομή του; Πάμε να δούμε.

 Ιάσονα, μίλησε σας μας για το background σου και πώς βρέθηκε στο δρόμο σου το Data Science

Έκανα το προπτυχιακό μου στη Φυσική και έπειτα συνέχισα με μεταπτυχιακό στο Freie Universitaet του Βερολίνου, όπου εκεί η πτυχιακή μου αφορούσε ,μεταξύ άλλων, ανάλυση δεδομένων από υπερταχείς παλμούς laser στο ινστιτούτο Max Born. Πιο συγκεκριμένα, μελετούσαμε ηλεκτρονιακές στάθμες σε πολύπλοκα βιομόρια.

Εκεί έγινε και η πρώτη μου επαφή με τη Python το 2014, και μου άρεσε πολύ από την αρχή. Είναι κάτι που έμαθα μόνος μου, αρχικά στα πλαίσια  student job και αργότερα για την ανάλυση των δεδομένων της πτυχιακής, αν και είχαμε κάποια βασικά μαθήματα προγραμματισμού στη σχολή μου.

Στην συνέχεια, θέλοντας να συνεχίσω την Ακαδημαϊκή μου πορεία, έκανα αίτηση για Διδακτορικό στο πανεπιστήμιο του Delft.

Επειδή μου άρεσε αυτό που έκανα στο μεταπτυχιακό, όπου τα δεδομένα που έπαιρνα τα ανέλυα και συνδύαζα θεωρία και πείραμα, έψαξα για κάποιο διδακτορικό όπου να μπορώ να κάνω κάτι παρόμοιο. Βρήκα λοιπόν μία θέση υποψήφιου διδάκτορα η οποία μοιραζόταν μεταξύ 2 groups, ένα πειραματικό και ένα θεωρητικό.

Ήταν στον τομέα της Βιοφυσικής και μελετούσαμε το πώς οι πρωτεΐνες αλληλεπιδρούν σε επίπεδο ενός μορίου με DNA και με RNA για παράδειγμα, οπότε εγώ έπαιρνα δεδομένα από το μικροσκόπιο, έκανα την ανάλυση με Python και ταυτόχρονα θεωρητική μοντελοποίηση με στατιστική φυσική και στοχαστικές μεθόδους.

Πριν τελειώσω το Διδακτορικό, είχα γυρίσει από την Ολλανδία κατά την περίοδο της καραντίνας, και ήμουν κάπως στα χαμένα γιατί δεν ήξερα πώς ακριβώς να συνεχίσω τη καριέρα μου, ειδικά από τη στιγμή που η Βιοφυσική και η Βιοτεχνολογία γενικότερα στην Ελλάδα είναι αρκετά υποανεπτυγμένες.

Επειδή μου άρεσε όμως πολύ ο προγραμματισμός και η ανάλυση δεδομένων και λιγότερο το εργαστηριακό κομμάτι, ήθελα η δουλειά μου να σχετίζεται με αυτά.

Γενικά πάντα με ενθουσίαζε το machine learning σαν τεχνολογία, αλλά δεν είχα την ευκαιρία να ασχοληθώ περισσότερο, αν και ήξερα καλή Python.

Ψάχνοντας λοιπόν διάφορα Workshops ή Bootcamps ώστε να δω πώς μπορώ να εμβαθύνω στο machine learning, πέτυχα το Data Science Bootcamp της Big Blue και έκανα απευθείας αίτηση.

 Πολύ ωραία! Πού θα έλεγες ότι σε βοήθησε περισσότερο το Bootcamp;

Αν και είχα καλή γνώση της Python και άλλων αντικειμένων όπως πιθανότητες και στατιστική, ήθελα περισσότερα πρακτικά skills και από την αρχή μου δόθηκε πρόσβαση σε πολλά εργαλεία για να αναλύω οποιοδήποτε είδος δεδομένων.

Είχαμε και τα projects που κάναμε τακτικά κατά τη διάρκεια του Bootcamp τα οποία μας έδιναν μεγάλη ελευθερία όσον αφορά την θεματολογία.  Είπα για παράδειγμα ότι θέλω να ασχοληθούμε με κομικς σε ένα από τα projects. Κάναμε λοιπόν clustering σε δεδομένα που είχαμε συλλέξει με web scraping, κατεβάζοντας δεδομένα από το διαδίκτυο και προσπαθήσαμε να προβλέψουμε ποιά χαρακτηριστικά ενός κόμικ μπορεί να το κάνουν να έχει τεράστια συλλεκτική αξία στο μέλλον. Ήταν ένα εξαιρετικά ευχάριστο project.

Αυτή η ελευθερία ήταν γενικά που μου κέντρισε πολύ το ενδιαφέρον και μου έδωσε κίνητρο, γιατί κατάλαβα ότι μαθαίνοντας κάποια, σχετικά απλά, εργαλεία μπορούσα να κάνω ό,τι θέλω.

Το Bootcamp επίσης μου έδωσε πολλά skills και πρακτικές γνώσεις για να παρακολουθήσω στην συνέχεια και πιο στοχευμένα κάποια μαθήματα, όπως για medical imaging analysis, και να έχω πολύ καλή απόδοση σε αυτό.

Σε γενικές γραμμές μπορώ να πω πως το Bootcamp μου άλλαξε πραγματικά τη ζωή γιατί εκεί που το βιογραφικό μου ήταν πολύ Ακαδημαικό και δεν είχα λάβει απάντηση από τις αιτήσεις δουλειάς που έστελνα, ξαφνικά είχα 2 προτάσεις για δουλειά αμέσως μετά την ολοκλήρωσή του.

Μια πρόταση ήρθε λόγω του τελικού project και μια λόγω του Δημήτρη, που ήταν ένας από τους instructors. Επομένως κατάφερα να βρω μια πολύ καλή δουλειά που μου επιτρέπει να δουλεύω εξ αποστάσεως με πολύ καλές συνθήκες, την οποία χωρίς το Bootcamp πολύ δύσκολα θα είχα καταφέρει να βρω.

Επιπλέον, το Bootcamp ήταν αρκετά διασκεδαστικό και μας έδινε περιθώριο να εξελιχθούμε προς του στόχους που είχε θέσει ο καθένας.. 

 Θες να μας πεις και μερικά λόγια για το τελικό project του Bootcamp;

Το τελικό project του Bootcamp ήταν σε συνεργασία με μια εταιρεία από την Ολλανδία, η οποία συνεργαζόταν συμβουλευτικά με το λιμάνι του Ρότερνταμ και ήθελαν να αυτοματοποιήσουν τις διαδικασίες χειρισμού των containers.

Μέσω computer vision δηλαδή, κάνοντας χρήση κλασικών τεχνικών machine learning και νευρωνικων δικτύων, καταλαβαίναμε τον προσανατολισμό ενός container σε στατικές εικόνες και βίντεο με τελικό σκοπό, στο μέλλον, να μπορούμε να παρακολουθήσουμε όλη τη πορεία του. Είχε πολύ ενδιαφέρον και μάλιστα μου έκαναν και πρόταση για μόνιμη δουλειά σαν Data Scientist στην συγκεκριμένη εταιρεία, λίγες ημέρες αφότου τελείωσε το project και το παρουσίασα.

 Για να έρθουμε στο σήμερα λοιπόν, πού εργάζεσαι και ποιος ο ρόλος σου;

Εν τέλει απέρριψα την πρόταση εκείνη επειδή μου έγινε και μια άλλη πρόταση μέσω ενός instructor του Bootcamp, του Δημήτρη Γάλλου, ο οποίος δουλεύει σε μια εταιρεία με έδρα την Ολλανδία η οποία κάνει AI στον τομέα της οδοντιατρικής.

Η πρόταση ήταν για junior θέση ως machine learning researcher, και είχε μια αρκετά απαιτητική συνέντευξη 5 σταδίων όπου έπρεπε να κάνω 1 μήνα προετοιμασία.

Πήγε όμως πολύ καλά και προσλήφθηκα αρχικά ως intern machine learning researcher και τώρα από τον Νοέμβριο έχω γίνει junior.

Αυτό που κάνω είναι να κατασκευάζω μοντέλα νευρωνικών δικτύων τα οποία αυτοματοποιούν διάφορες διαδικασίες που παραδοσιακά οι οδοντίατροι και οι χειρουργοί κάνουν manually. Εκπαιδεύουμε δηλαδή μοντέλα να ανιχνεύουν ένα-ένα τα δόντια, τα οστά τα νεύρα κτλ και να τα απεικονίζουν αυτόματα σε 3D μορφή.

 Πολύ ενδιαφέρον! Από την έως τώρα εμπειρία σου, ποιοί κλάδοι θεωρείς θα δουν τη μεγαλύτερη ανάπτυξη στο Data Science;

Θεωρώ ότι το Data Science έχει δώσει το μεγαλύτερο value στο marketing και στο user experience μέχρι στιγμής, μέσω προτεινόμενων προϊόντων και γενικά στη συμπεριφορά καταναλωτή. 

Επίσης στο medical imaging έχει πολύ καλή και άμεση εφαρμογή, γιατί πολλά μοντέλα ανίχνευσης καρκίνου π.χ. σε MRI ή τα εγκεφαλογραφήματα έχουν ήδη πιάσει απόδοση που συγκρίνεται με ένα συμβούλιο ιατρών.

Τα επόμενα χρόνια θεωρώ θα δούμε εφαρμογή και σε ακόμα περισσότερους τομείς, όπως είναι τα Large Language Models, είδαμε τι γίνεται με το ChatGPT, και φαντάζομαι ίσως σε μια 10ετία να αρχίσει να φαίνεται η αξία του και στα αυτοοδηγούμενα οχήματα.

Σαν γενικότερο τομέα όμως η πιο εύκολη και άμεση εφαρμογή των νευρωνικών δικτύων θεωρώ πως είναι στο computer vision.

Ιάσονα, σε ευχαριστούμε για τον χρόνο σου και τη γνώση που μοιράστηκες μαζί μας!

Η ομάδα της BigBlue Data Academy.

Ιάσονας Κατέχης