Διάγραμμα Ροής Δεδομένων: Ορισμός & Παραδείγματα
Καθημερινά κατακλυζόμαστε διαρκώς από μια πληθώρα πληροφοριών και δεδομένων.
Καταλαβαίνουμε λοιπόν πως είναι σημαντική η εξασφάλιση της ποιότητας των data προκειμένου να αποφευχθούν λάθη, όπως επίσης και η χρήση κάποιων μεθόδων και εργαλείων για την οπτικοποίηση αυτών των δεδομένων.
Για τη διευκόλυνση των διαφόρων διεργασιών στον επιχειρηματικό κλάδο και όχι μόνο, έχουν εφαρμοστεί διάφορες τέτοιες πρακτικές μεταξύ των οποίων και το γνωστό διάγραμμα ροής δεδομένων.
Σε αυτό λοιπόν το άρθρο θα δούμε:
Τι είναι ένα διάγραμμα ροής δεδομένων
Ποια η σημασία του
Παραδείγματα ενός διαγράμματος ροής δεδομένων
Ας ξεκινήσουμε με έναν ορισμό.
Τι Είναι ένα Διάγραμμα Ροής Δεδομένων
Ένα διάγραμμα ροής δεδομένων ή αλλιώς DFD είναι μια γραφική αναπαράσταση της ροής των πληροφοριών μέσα σε ένα σύστημα ή μια διαδικασία.
Χρησιμοποιείται συχνά για την οπτικοποίηση της επεξεργασίας της ροής των data, των δεδομένων εισόδου και εξόδου καθώς και των αποθηκών και των διαδικασιών που μετασχηματίζουν τα δεδομένα.
Ένα διάγραμμα ροής δεδομένων δεν παρέχει πληροφορίες για το χρονισμό των διεργασιών, και συνεπώς διαφοροποιείται από ένα διάγραμμα ροής (flowchart), το οποίο δείχνει τη ροή ελέγχου μέσα σε έναν αλγόριθμο.
Υπάρχουν δύο τύποι διαγραμμάτων ροής δεδομένων, το λογικό και το φυσικό.
Τα λογικά διαγράμματα περιγράφουν τη θεωρητική διαδικασία ροής πληροφοριών μέσω ενός συστήματος, όπως από πού προέρχονται τα δεδομένα, πώς αλλάζουν και πού καταλήγουν.
Τα φυσικά διαγράμματα περιγράφουν την πρακτική διαδικασία ροής πληροφοριών μέσω ενός συστήματος, όπως για παράδειγμα τον τρόπο με τον οποίο τα αρχεία ή το συγκεκριμένο λογισμικό επηρεάζουν τη ροή των πληροφοριών του.
Τα λογικά και τα φυσικά διαγράμματα μπορούν να χρησιμοποιηθούν συνδυαστικά για καλύτερη κατανόηση μιας διαδικασίας με μεγαλύτερη λεπτομέρεια.
Γιατί Είναι Σημαντικό το Διάγραμμα Ροής Δεδομένων;
Το διάγραμμα ροής δεδομένων ήταν ιδιαίτερα δημοφιλές στη δεκαετία του 1970 και στηρίζεται στα μοντέλα υπολογισμού γραφημάτων ροής δεδομένων των David Martin και Gerald Estrin.
Είναι λοιπόν ιδιαίτερα σημαντικό και χρησιμοποιείται ευρέως ακόμα και σήμερα πολύ συχνά στην ανάλυση και το σχεδιασμό ενός συστήματος για την παροχή συστημάτων υψηλού επιπέδου.
Μπορεί ακόμη να χρησιμοποιηθεί από τους επιστήμονες δεδομένων για τον εντοπισμό πιθανών σφαλμάτων σε ένα σύστημα, συνδράμοντας έτσι στην βελτίωση της αποτελεσματικότητας και στην ανάπτυξη βέλτιστων διαδικασιών.
Επιπλέον, ένα διάγραμμα ροής δεδομένων μπορεί να βοηθήσει τους Data Scientists να εντοπίσουν διαδικασίες μέσα σε ένα σύστημα που μπορούν να αυτοματοποιηθούν, εξοικονομώντας έτσι πολύτιμο χρόνο και πόρους.
Αφού είδαμε τη σημασία του, ας δούμε ακολούθως πιο αναλυτικά τα βασικά στοιχεία ενός διαγράμματος δεδομένων, τα οποία αναπαριστώνται με ορισμένα σύμβολα.
Βασικά Στοιχεία Διαγράμματος Ροής Δεδομένων
Ένα διάγραμμα ροής δεδομένων συνήθως χρησιμοποιεί σύμβολα όπως κύκλους, ορθογώνια και βέλη για την απεικόνιση των διαφόρων στοιχείων του συστήματος και της ροής δεδομένων μεταξύ τους.
Οι συμβολισμοί αυτοί περιγράφουν την κατεύθυνση ροής δεδομένων ενός συστήματος ή μιας διεργασίας για την αναπαράσταση των εξής 4 δομικών στοιχείων ενός διαγράμματος ροής δεδομένων:
Εξωτερική οντότητα (external entity), η οποία είναι ένα εξωτερικό σύστημα για την αποστολή ή λήψη δεδομένων, από και προς το σύστημά μας. Οι εξωτερικές οντότητες είναι είτε οι πηγές είτε οι προορισμοί των πληροφοριών, και επομένως τοποθετούνται συνήθως στις άκρες του διαγράμματος.
Διεργασία (process), δηλαδή η διαδικασία που χειρίζεται τα δεδομένα και τη ροή τους λαμβάνοντας εισερχόμενα δεδομένα, τροποποιώντας τα και παράγοντας εν τέλει ένα αποτέλεσμα.
Χώροι αποθήκευσης δεδομένων (data store), οι οποίοι αποθηκεύουν πληροφορίες για μελλοντική χρήση, όπως ένας πίνακας βάσης δεδομένων.
Ροή δεδομένων (data flow), η διαδρομή που ακολουθούν οι πληροφορίες μεταξύ εξωτερικών οντοτήτων, διαδικασιών και αποθηκών δεδομένων. Μπορούν να χρησιμοποιηθούν βέλη για να απεικονίσουν την κατεύθυνση της ροής δεδομένων.
Τα συστήματα συμβόλων που χρησιμοποιούνται, έχουν λάβει την ονομασία τους από τους δημιουργούς τους: Yourdon & De Marco και Gane and Sarson.
Η βασική διαφορά έγκειται στα σύμβολα που χρησιμοποιούνται όπως βλέπουμε στον παραπάνω πίνακα.
Επίπεδα Διαγράμματος Ροής Δεδομένων
Οι επαγγελματίες σε διάφορους κλάδους, όπως οι Python Developers, οι Software Engineers, Data Scientists και Data Engineers μπορούν να χρησιμοποιήσουν το διάγραμμα ροής δεδομένων για να κατανοήσουν καλύτερα, να βελτιστοποιήσουν ή να εφαρμόσουν ένα νέο σύστημα ή διαδικασία.
Ένα διάγραμμα ροής δεδομένων μπορεί να χωριστεί σε επίπεδα, ξεκινώντας από το επίπεδο 0 και φτάνοντας έως το επίπεδο 3.
Ας τα δούμε ακολούθως.
Επίπεδο 0
Το επίπεδο 0, γνωστό και ως διάγραμμα περιβάλλοντος, είναι μια βασική επισκόπηση ολόκληρου του συστήματος ή της διαδικασίας που αναλύεται ή μοντελοποιείται.
Tο σύστημα απεικονίζεται ως μια ενιαία διαδικασία υψηλού επιπέδου, με τη σχέση του με τις εξωτερικές οντότητες.
Είναι εύκολα κατανοητό από ένα ευρύ κοινό, συμπεριλαμβανομένων των data analysts και των developers.
Επίπεδo 1
Το επίπεδο 1 παρέχει μια πιο λεπτομερή ανάλυση των τμημάτων του επιπέδου 0.
Παρουσιάζονται οι κύριες λειτουργίες που εκτελούνται από το σύστημα και αναλύεται η διαδικασία υψηλού επιπέδου του διαγράμματος περιβάλλοντος στις υπο-διεργασίες του.
Επίπεδο 2 & 3
Συνεχίζοντας, το επίπεδο 2 πηγαίνει ένα βήμα πιο βαθιά σε τμήματα του επιπέδου 1.
Επομένως, μπορεί να χρειαστεί περισσότερο κείμενο για την επίτευξη του αναγκαίου επιπέδου λεπτομέρειας αναφορικά με τη λειτουργία του συστήματος.
Το επίπεδο 3 είναι ασυνήθιστο και αυτό οφείλεται σε μεγάλο βαθμό στην ποσότητα των απαιτούμενων λεπτομερειών και στην πολυπλοκότητά τους.
Με Λίγα Λόγια
Μιλήσαμε λοιπόν αναλυτικά για το τι είναι ένα Διάγραμμα Ροής Δεδομένων και γιατί είναι σημαντικό, χρησιμοποιώντας κάποια παραδείγματα για καλύτερη και πιο ενδελεχή κατανόηση.
Ο κλάδος της επιστήμης των δεδομένων είναι μία εξαιρετικά ενδιαφέρουσα επιλογή με πολλές ευκαιρίες καριέρας.
Αν θέλεις και εσύ να ασχοληθείς με τον ανερχόμενο κλάδο της επιστήμης των δεδομένων, ανακάλυψε το Data Science Bootcamp της Big Blue και γίνε πιστοποιημένος Data Scientist σε μόλις 3 μήνες!