JSON (JavaScript Object Notation)
Τι είναι το JSON;
Μια ελαφριά μορφή δεδομένων που χρησιμοποιείται για την ανταλλαγή πληροφοριών μεταξύ συστημάτων. Σημαίνει JavaScript Object Notation. Αποθηκεύει και μεταδίδει δεδομένα αυστηρά ως κείμενο, οργανώνοντας τις πληροφορίες σε δομημένα ζεύγη κλειδιού-τιμής και ταξινομημένες λίστες (πίνακες).
Ποιοι συγκεκριμένοι τύποι δεδομένων μπορούν να αποθηκευτούν σε ένα αρχείο JSON;
Το JSON υποστηρίζει έξι βασικούς τύπους δεδομένων: συμβολοσειρές (κείμενο που περικλείεται σε διπλά εισαγωγικά), αριθμούς (ακέραιους ή κινητής υποδιαστολής), λογικές τιμές (αληθές ή ψευδές), μηδενικές τιμές (κενές τιμές), πίνακες (ταξινομημένες λίστες τιμών που περικλείονται σε αγκύλες [ ]) και αντικείμενα (μη ταξινομημένες συλλογές ζευγών κλειδιού-τιμής που περικλείονται σε αγκύλες { }). Δεν υποστηρίζει εγγενώς ημερομηνίες, συναρτήσεις ή δυαδικά δεδομένα.
Πώς διαφέρει το JSON δομικά από την XML;
Τόσο το JSON όσο και το XML χρησιμοποιούνται για τη δομή και τη μεταφορά δεδομένων, αλλά χρησιμοποιούν διαφορετικές συντάξεις. Η XML χρησιμοποιεί μια ιεραρχική δομή που βασίζεται σε ετικέτες ανοίγματος και κλεισίματος (markup). Το JSON βασίζεται σε τυπικές αγκύλες προγραμματισμού και κόμματα, καθιστώντας τα αρχεία μικρότερα σε μέγεθος και ταχύτερα για την ανάλυση από τις μηχανές. Επιπλέον, το JSON ευθυγραμμίζεται άμεσα με τις δομές δεδομένων που χρησιμοποιούνται στις σύγχρονες γλώσσες προγραμματισμού, εξαλείφοντας την ανάγκη σύνταξης πολύπλοκου κώδικα ανάλυσης.
Ποιοι είναι οι κύριοι τεχνικοί περιορισμοί ή οι αυστηροί κανόνες του JSON;
Το JSON έχει μια πολύ αυστηρή σύνταξη που πρέπει να ακολουθείται τέλεια. Όλα τα κλειδιά κειμένου πρέπει να περικλείονται σε διπλά εισαγωγικά. Τα μονά εισαγωγικά δεν είναι έγκυρα. Ένα μόνο κόμμα που λείπει ή ένα επιπλέον κόμμα στο τέλος μιας λίστας θα προκαλέσει την πλήρη αποτυχία της διαδικασίας ανάλυσης. Επιπλέον, η προδιαγραφή JSON δεν επιτρέπει σχόλια μέσα στο αρχείο, πράγμα που σημαίνει ότι οι προγραμματιστές δεν μπορούν να προσθέσουν επεξηγηματικό κείμενο απευθείας μέσα στη δομή δεδομένων.
Πώς χρησιμοποιείται πρακτικά το JSON στον τομέα της Επιστήμης Δεδομένων;
Στην επιστήμη δεδομένων, το JSON είναι η κύρια μορφή που χρησιμοποιείται για την εξαγωγή ακατέργαστων δεδομένων από εξωτερικές Διεπαφές Προγραμματισμού Εφαρμογών (API) και βάσεις δεδομένων NoSQL όπως το MongoDB. Για παράδειγμα, ένας επιστήμονας δεδομένων που ανακτά δεδομένα χρηματοπιστωτικής αγοράς σε πραγματικό χρόνο από ένα API ιστού θα λάβει την απάντηση ως αρχείο JSON. Στη συνέχεια, θα χρησιμοποιήσουν την Python και τη βιβλιοθήκη pandas συγκεκριμένα τη συνάρτηση pandas.read_json() για να μετατρέψουν αυτά τα ιεραρχικά δεδομένα κειμένου απευθείας σε ένα δομημένο DataFrame. Μόλις βρεθούν σε μορφή DataFrame, τα δεδομένα μπορούν να καθαριστούν, να μετασχηματιστούν μαθηματικά και να τροφοδοτηθούν σε αλγόριθμους μηχανικής μάθησης.