Σταύρος Τσίλογλου: Data Scientist στη Generali

Σήμερα έχουμε τη χαρά να έχουμε μαζί μας τον Σταύρο, ο οποίος με background στα οικονομικά τώρα εργάζεται στον ασφαλιστικό κλάδο ως Data Scientist.

Ας δούμε τη πορεία του έως τώρα, καθώς και την εμπειρία του από το Data Science Bootcamp.

 Σταύρο, πες μας λίγα λόγια για εσένα και πώς βρέθηκε στον δρόμο σου η επιστήμη των δεδομένων. 

Τη στιγμή αυτή εργάζομαι εδώ και 3 μήνες στη Generali και σπούδασα οικονομικά στο Οικονομικό Πανεπιστήμιο Αθηνών.

Έτυχε λοιπόν ο δρόμος μου να με βγάλει σε μια πολυεθνική εταιρεία, όπου στο τμήμα που εργαζόμουν ασχολήθηκα με δεδομένα, βάσεις δεδομένων και λίγο reporting.

Εκεί γεννήθηκε το ενδιαφέρον μου για τα δεδομένα και σκέφτηκα πώς μπορώ να τα συνδυάσω με προγραμματισμό, αν και δεν είχα πολύ καθαρή εικόνα, πέρα από κάποια μαθήματα που είχα κάνει στη σχολή.

Επομένως έψαξα μόνος μου στο διαδίκτυο, ασχολήθηκα λίγο με τον προγραμματισμό για να δω αν όντως με τραβάει, και όταν έψαχνα πώς γίνεται να συνδυάσω τον προγραμματισμό με τα δεδομένα ανακάλυψα το Data Science.

Έτσι πήρα το θάρρος μετά από 3.5 χρόνια εργασίας στα οικονομικά να μεταφερθώ στην επιστήμη και ανάλυση των δεδομένων.

 Πολύ ενδιαφέρον! Πώς θα περιέγραφες λοιπόν μια καθημερινή μέρα στη δουλειά σου; Με τι ασχολείσαι και τι εργαλεία χρησιμοποιείς;

Μια καθημερινή μέρα ξεκινάει με καφέ για να μπορούμε να δουλέψουμε!

Επειδή είμαστε σε έναν κλάδο που εμπλέκεται με πολλούς τομείς μιας εταιρείας, υπάρχουν αρκετές συναντήσεις μέσα στην ημέρα σχετικά με ενημερώσεις ή κινήσεις που μπορούν να γίνουν.

Όσον αφορά τα εργαλεία, βασικό εργαλείο για Data Science είναι η Python, η οποία είναι και η πιο εύχρηστη για αυτή την εργασία.

Για Data Analysis χρησιμοποιώ διάφορα εργαλεία, τη στιγμή αυτή περισσότερο το Excel και άλλο ένα πρόγραμμα που λέγεται SAS Enterprise Guide.

Από εκεί και πέρα δεν υπάρχει περιορισμός στα εργαλεία που μπορούν να χρησιμοποιηθούν.

 Μιας που αναφέραμε μερικά εργαλεία, ποια είναι και μερικά soft skills που χρειάζεται ένα άτομο στη θέση σου;

Θεωρώ απαραίτητη την πολύ καλή επικοινωνία και συνεργατικότητα επειδή τα δεδομένα προέρχονται από όλη τη βάση μιας εταιρείας, επομένως η επικοινωνία ανάμεσα στα τμήματα είναι σημαντική.

Ειδικά όταν χειρίζεσαι δεδομένα μιας μεγάλης εταιρείας, κάποιες φορές μπορεί να μην γνωρίζεις ακριβώς την ουσία των δεδομένων που χειρίζεσαι, επομένως θα πρέπει να αναφερθείς στο εκάστοτε τμήμα για να σε βοηθήσει είτε για κάποια αποτελέσματα που θες να παράγεις, είτε για να καταλάβεις το βάρος της σημασίας των δεδομένων που έχεις στα χέρια σου.

Φυσικά παίζει σημαντικό ρόλο και η προσαρμοστικότητα, γιατί τα δεδομένα χρειάζονται μια συγκεκριμένη μεταχείριση και ανάλογα με τον κλάδο χρειάζεται η προσαρμοστικότητα για να αξιοποιήσεις τα στοιχεία που έχεις λάβει.

 Έχοντας δουλέψει σε μια ελληνική εταιρεία, υπάρχει κάτι που κρατάει τις ελληνικές εταιρείες πίσω όσον αφορά τη διαχείριση των δεδομένων τους;

Επειδή σαν κλάδος είμαστε ακόμη σε πολύ πρώιμο στάδιο, ένα τμήμα μπορεί να είναι πολύ νεοσύστατο.

Επομένως οι ρόλοι (data scientists/data analysts) δεν είναι πάντα τόσο ξεκάθαροι, αλλά αρκετά ευέλικτοι.

Οι δουλειές κάθε ρόλου δεν έχουν διαμορφωθεί ακόμα ξεκάθαρα λόγω του ότι ο κλάδος στην Ελλάδα δεν έχει αναπτυχθεί ακόμα πολύ.

Έτσι, κάποιος ο οποίος θέλει για παράδειγμα να είναι αποκλειστικά data analyst, πιθανότατα οι αρμοδιότητές του να μην είναι μόνο αυτές. Θα εμπλέκεται σε άλλα projects και ρόλους.

Σαν γενικότερο θέμα, χρειάζεται λίγο χρόνο η μετάβαση της αξιοποίηση των δεδομένων, γιατί η δουλεία μας βασίζεται πολύ στη ποιότητα των δεδομένων που θα λάβουμε. Από το data entry μέχρι και τη διατήρησή τους, επομένως χρειάζεται παραπάνω προσοχή στον τρόπο καταχώρησης και διατήρησης των δεδομένων, για να μπορούν να αξιοποιηθούν έπειτα σωστά.

 Σωστά! Όσον αφορά τη BigBlue, πώς βρήκες το Bootcamp και τι εντυπώσεις έχεις από αυτό;

Το Data Science Bootcamp το ανακάλυψα έπειτα από έρευνα στο διαδίκτυο, γιατί προσωπικά δεν ήθελα να κάνω κάποιο μεταπτυχιακό λόγω του μεγάλου κόστους του.

Επίσης, έψαχνα κάτι που θα είχε μεγάλη πρακτική εφαρμογή και όχι πολλές ώρες θεωρίας, επομένως έκανα αίτηση για το Bootcamp. Ήθελα να το κάνω και σε πιο συμπυκνωμένη μορφή και είδα ότι τα μαθήματα ανταποκρίνονται 100% σε αυτά που υπόσχεται το πρόγραμμα σπουδών.

Πέρα από αυτά, έχω να πω ότι υπάρχει πολύ μεγάλη έμφαση στα εργαλεία και τις τεχνικές που χρησιμοποιούνται σήμερα, ώστε κάποιος που ασχολείται επαγγελματικά με αυτό να κάνει εφαρμογή των πραγμάτων.

Εγώ από συνεντεύξεις που έκανα και την εργασία μου, δεν υπάρχουν εργαλεία που χρησιμοποίησα και να μην τα είχα δει πρώτα στο Bootcamp.

Όλο το πρόγραμμα σπουδών και το τελικό project είναι πολύ ρεαλιστικά και ανταποκρίνονται στο τι συμβαίνει πραγματικά και στο τι θα βρεις στη πορεία σου.

Σαν Σταύρος είχα πολύ καλή επικοινωνία και χημεία με τους καθηγητές. Ήταν εκεί για οτιδήποτε χρειαζόμουν και επειδή ήρθα σε επαφή με αρκετούς καθηγητές, είδα ότι υπήρχε πρόγραμμα και επαγγελματισμός από πίσω, για τη σωστή επιλογή των ανθρώπων αυτών.

 Γενικά το δίλημμα μεταπτυχιακού ή Bootcamp που ανέφερες είναι κάτι που συναντάμε συχνά.

Ναι, προφανώς είναι το τι θέλει ο καθένας, αλλά εγώ θεωρώ ότι δεν είναι ιδιαίτερα πρακτικό να κάνεις 7 ώρες θεωρία.

Δηλαδή, η πληροφορία που μπορείς να κρατήσεις σαν άνθρωπος είναι περιορισμένη και επηρεάζεται πολύ η ποσότητα πληροφορίας που θα διατηρήσεις και θα χρειαστείς εν τέλει.

Επομένως το πρακτικό κομμάτι του Bootcamp δεν βοηθάει μόνο στην απλή κατανόηση,  αλλά έχεις τις γνώσεις να προχωρήσεις στο επόμενο μάθημα.

Γιατί αν εγώ από ένα μάθημα 8 ωρών κρατήσω τις 4 θεωρητικές, όταν πάω στο επόμενο θα έχω κενά. Και όταν αυτό το φαινόμενο είναι συνεχόμενο για 3 μήνες, τα κενά που θα πρέπει να καλύψω θα είναι πολύ μεγάλα.

 Ισχύει! Όσον αφορά το τελικό project με τι ασχολήθηκες;

Το project ήταν σε συνεργασία με το efood και είχε να κάνει με το NLP.

Αυτό που έπρεπε να κάνουμε ήταν να πάρουμε τις περιγραφές των προϊόντων και να βοηθήσουμε στη κατηγοριοποίησή τους στη πλατφόρμα.

Ήταν αρκετά δύσκολο, γιατί τουλάχιστον για την επεξεργασία κειμένου, η ελληνική γλώσσα δεν βοηθάει επειδή είναι ιδιαίτερη σε σχέση με τα αγγλικά.

Όταν δηλαδή σε μεγάλες εφαρμογές δεν αξιοποιούνται βιβλιοθήκες για την ελληνική γλώσσα που να μπορείς να πάρεις έτοιμες και να προσαρμόσεις, πρέπει λίγο-πολύ να τα κάνεις από την αρχή τα πράγματα.

Μια ακόμα πρόκληση ήταν ο κλάδος, καθώς μια περιγραφή που έδινε ένα κατάστημα για να κάνει ένα προϊόν ελκυστικό, μπορεί να μην βοηθούσε στη κατηγοριοποίησή του. 

Όπως και να έχει, αυτά που ασχολήθηκα στο project ήταν πολύ κοντά σε άλλο project NLP που καλέστηκα να πραγματοποιήσω στη δουλειά μου, από τα προβλήματα που αντιμετώπισα και τη μεθοδολογία, μέχρι και τον τρόπο προσέγγισης του προβλήματος.

 Τέλεια! Πριν κλείσουμε, τι συμβουλή θα έδινες σε έναν νέο που θέλει να ασχοληθεί με τα δεδομένα, προερχόμενος από έναν κλάδο που δεν σχετίζεται άμεσα με αυτά;

Προσωπικά θα έλεγα να έχει κάνει μια μικρή προεργασία ότι όντως αυτό που θα κάνει του ταιριάζει, ειδικά αν προέρχεται από έναν κλάδο ο οποίος δεν έχει επαφή με την ανάλυση δεδομένων.

Αλλά στο τέλος της ημέρας, ο άνθρωπος που ενδιαφέρεται για αυτό που κάνει και έχει τη νοοτροπία ότι θα μάθει όσα περισσότερα μπορεί, τότε θα του ταιριάξει πολύ ο κλάδος των δεδομένων.

 

Ευχαριστούμε πολύ Σταύρο για την όμορφη συνέντευξη!

Σταύρος Τσίλογλου