Παρασκευή, 24 Ιουνίου 2016

"Ανοιχτά δεδομένα και Social media αυστηρά για επιστήμονες"

  • Ακολουθεί άρθρο ομάδας μεταπτυχιακών φοιτητριών του Πανεπιστημίου Μακεδονίας στο τμήμα της Εφαρμοσμένης Πληροφορικής. 
  • Στα πλαίσια του μαθήματός  "Τεχνολογίες Ιστού και Ανάλυση Δεδομένων Ιστού" ασχολήθηκε με τα ανοικτά δεδομένα -συγκεκριμένα με την ανοικτή βάση myExperiment Ontology- και παρουσιάζει την παρακάτω εργασία:

Ανοιχτά δεδομένα και Social media αυστηρά για επιστήμονες!
Ζούμε πλέον σε μία εποχή που η τεχνολογία κατέχει σημαντικό ρόλο στη ζωή μας και στην εξέλιξη της κοινωνίας, καθώς τα πάντα περιστρέφονται γύρω της.
Η ραγδαία εξέλιξη της τεχνολογίας έχει δώσει πλέον τη δυνατότητα στον καθένα να έχει ελεύθερη πρόσβαση στη... γνώση μέσω των ανοιχτών δεδομένων. Παράλληλα, αναπόσπαστο κομμάτι της καθημερινής ζωής του ανθρώπου αποτελούν τα μέσα κοινωνικής δικτύωσης, που πλέον (όσο και αν σε κάποιους ίσως φανεί περίεργο!) τα συναντάμε ακόμα και στον κλάδο της επιστήμης.

Τι είναι όμως τα Ανοιχτά Δεδομένα (open data); Σύμφωνα με το Ίδρυμα Ανοικτής Γνώσης (Open Knowledge Foundation) «ανοιχτά είναι τα δεδομένα που μπορούν ελεύθερα να χρησιμοποιηθούν, να επαναχρησιμοποιηθούν και να αναδιανεμηθούν από οποιονδήποτε – υπό τον όρο να γίνεται αναφορά στους δημιουργούς και να διατίθενται, με τη σειρά τους, υπό τους ίδιους όρους.»
Πιο συγκεκριμένα, τα δεδομένα αυτά θα πρέπει να πληρούν και κάποιες προϋποθέσεις, όπως να είναι διαθέσιμα και προσβάσιμα από τον καθένα για λήψη από το διαδίκτυο σε μία αναγνώσιμη μορφή, για επεξεργασία και αναδιανομή με χαμηλό κόστος αναπαραγωγής. Παράλληλα, θα πρέπει να πληρούν και δύο βασικές κατηγορίες:
Να είναι τεχνολογικά ανοικτά, δηλαδή να είναι διαθέσιμα σε μια μορφή που μπορεί να γίνει κατανοητή από υπολογιστές (machine-readable) ώστε να μπορούν εύκολα να ανακτηθούν και να επεξεργαστούν.
Να είναι νομικά ανοικτά, αναλυτικότερα να έχουν ρητή άδεια που να επιτρέπει εμπορική χρήση και επαναχρησιμοποίηση τους χωρίς περιορισμούς.

Γιατί όμως να χρησιμοποιήσουμε ανοιχτά δεδομένα και κυρίως κυβερνητικά ανοιχτά δεδομένα; Για τρεις πολύ απλούς αλλά σημαντικούς λόγους. Υπάρχει διαφάνεια όσον αφορά την πρόσβαση, το διαμοιρασμό αλλά και την επεξεργασία των δεδομένων. Παράλληλα, ανοίγοντας οι κυβερνήσεις τα δεδομένα τους θα παρέχουν τη δυνατότητα για δημιουργία νέων πρωτοποριακών υπηρεσιών και επιχειρηματικών δραστηριοτήτων, οι οποίες θα προσφέρουν σημαντικά στην εξέλιξη της κοινωνίας. Τέλος, οι πολίτες θα έχουν πλέον τη δυνατότητα να ενημερώνονται και να συμμετέχουν ενεργά στις κυβερνητικές διαδικασίες.

Ακόμη, μεγάλο ενδιαφέρον παρουσιάζει και η δημοσίευση στο διαδίκτυο των ανοιχτών δεδομένων και η μεταξύ τους διασύνδεση (linked open data), που αποτελεί ίσως το μεγαλύτερο βήμα εξέλιξης στον Παγκόσμιο Ιστό και η οποία κερδίζει συνεχώς έδαφος καθώς πλέον οι κυβερνήσεις είναι σε θέση να αντιληφθούν τα πλεονεκτήματα αυτής της πρακτικής.

ΓΙΑΤΙ ΚΑΙ ΟΙ ΕΠΙΣΤΗΜΟΝΕΣ ΧΡΗΣΙΜΟΠΟΙΟΥΝ ΤΑ SOCIAL MEDIΑ

Τα μέσα κοινωνικής δικτύωσης (social media) στις μέρες μας γίνονται ολοένα και πιο διαδεδομένα. Ειδικότερα, τα δημοφιλέστερα μέσα κοινωνικής δικτύωσης είναι: το Facebook κυρίως για προσωπική χρήση, το Linkedin για επαγγελματική χρήση, το Twitter για διαμοιρασμό σύντομων μηνυμάτων και το Instagram για διαμοιρασμό φωτογραφιών. Υπάρχουν όμως και εξειδικευμένα μέσα κοινωνικής δικτύωσης, όπως το MyExperiment (http://www.myexperiment.org/home), που απευθύνεται συγκεκριμένα σε επιστήμονες! Γιατί και οι επιστήμονες θέλουν έναν χώρο που να μπορούν να μοιράζονται τη δουλειά τους και να επικοινωνούν μεταξύ τους.





Ας αναλύσουμε λοιπόν συνοπτικά την πλατφόρμα MyExperiment. Το MyExperiment είναι μια συνεργατική πλατφόρμα στην οποία οι επιστήμονες μπορούν να δημοσιεύουν ροές εργασιών και πειράματα αλλά και να τα μοιράζονται μεταξύ τους. Οι ροές εργασιών, τα λεγόμενα πακέτα (που είναι άλλα ψηφιακά αντικείμενα) μπορούν να ανταλλάσσονται και να αναζητούνται σαν εικόνες και βίντεο στο διαδίκτυο. Αντίθετα με τις κοινές πλατφόρμες κοινωνικής δικτύωσης, το MyExperiment καταλαβαίνει τις ανάγκες των επιστημόνων και προωθεί την συνεργασία μεταξύ διαφόρων επιστημών.

Τα δεδομένα του MyExperiment που διαμοιράζονται χωρίζονται στις εξής κατηγορίες:
-Διαχείριση περιεχομένου
-Κοινωνική δικτύωση
-Σχολιασμός αντικειμένου

Αναφορικά, το κοινωνικό δίκτυο MyExperiment αριθμεί περίπου 10.000 μέλη, 370 γκρουπ, 2.700 ροές εργασιών, 860 αρχεία and 360 πακέτα.

Αρχικά, μελετήσαμε την πλατφόρμα MyExperiment ώστε να βγάλουμε κάποια αποτελέσματα σχετικά με το αν οι επιστήμονες συμμετέχουν σε πλατφόρμες κοινωνικής δικτύωσης όπως αυτή, το αν είναι ενεργοί χρήστες, το τι είδους επιστήμονες συμμετέχουν περισσότερο και είναι πιο "κοινωνικοί" σε τέτοιο περιβάλλον. Στη συνέχεια θέσαμε ορισμένα ερωτήματα με τη βοήθεια της γλώσσας SPARQL κάνοντας χρήση του endpoint της βάσης (διαδικτυακός χώρος όπου τίθενται ερωτήματα σε μορφή SPARQL από το χρήστη και επιστρέφονται τα ανάλογα αποτελέσματα που προκύπτουν από τα δεδομένα της εκάστοτε βάσης), όπου χρησιμοποιήθηκε ο γράφος που παρουσιάζεται στην εικόνα 3. Τέλος, οπτικοποιήσαμε τα δεδομένα χρησιμοποιώντας το πρόγραμμα Sgvizler και εκπονήσαμε στατιστική ανάλυση με τη χρήση του προγράμματος R.

Παρατηρώντας την εικόνα 4, αντιλαμβανόμαστε ότι ο αριθμός των ανακοινώσεων είναι σχετικά μικρός, με τις μέγιστες ανακοινώσεις να ανέρχονται στις 40, ενώ το μεγαλύτερο κομμάτι να περιλαμβάνει από 0 έως 10. Συμπεραίνουμε λοιπόν πως η κινητικότητα είναι σχετικά χαμηλή σε σχέση με τον αριθμό των εγγεγραμμένων χρηστών.

Από τις μελέτες μας παρατηρήσαμε πως οι περισσότεροι χρήστες δεν έχουν πάνω από 2-3 φιλίες, αριθμός ιδιαίτερα χαμηλός. Στο παρακάτω διάγραμμα (εικόνα 5) φαίνεται ξεκάθαρα πως το μεγαλύτερο μέρος των χρηστών έχει από 1 έως 25 “φίλους” (μεγαλύτερη συγκέντρωση κουκκίδων) με ελάχιστους να ξεχωρίζουν (ελάχιστη συγκέντρωση στις μεγαλύτερες τιμές). Επίσης, ανακαλύψαμε ότι ο πιο δημοφιλής χρήστης έχει μόλις 97 φιλίες.

Από τις υπόλοιπες αναλύσεις που κάναμε, θα αναφέρουμε μερικά σημαντικά αποτελέσματα. Οι Έλληνες χρήστες της πλατφόρμας είναι μόνο 9, αριθμός ιδιαίτερα χαμηλός. Οι περισσότεροι χρήστες είναι από το Ηνωμένο Βασίλειο, τις ΗΠΑ, Γερμανία και Ολλανδία. Οι χώρες με τη μικρότερη συμμετοχή είναι οι λιγότερο ανεπτυγμένες, όπως Φιλιππίνες, Μαρόκο, Ταιβάν κλπ.
Όσον αφορά τους τομείς απασχόλησης των χρηστών, 47 από αυτούς απασχολούνται στον τομέα της πληροφορικής. Επίσης το μεγαλύτερο αριθμό χρηστών κατέχουν ο τομέας της πληροφορικής και της εκπαίδευσης.
Γενικά παρατηρήσαμε επίσης ότι οι χρήστες δεν συνδέονταν συχνά στην πλατφόρμα, και πως ο τελευταίος Έλληνας χρήστης συνδέθηκε το 2014.

*Η έρευνα και το παρόν άρθρο συντάχθηκε από τις μεταπτυχιακές φοιτήτριες Γεωργιάδου Ευαγγελία, Καματερού Ανθή, Καρβουνίδου Στέλλα, Λάππα Βασιλική και Σαράδογλου Ελισάβετ, του Προγράμματος Μεταπτυχιακών Σπουδών του Πανεπιστημίου Μακεδονίας στην Εφαρμοσμένη Πληροφορική με κατεύθυνση «Ηλεκτρονικό Επιχειρείν και Τεχνολογία Καινοτομίας (E-Business and Innovation Technology)», στα πλαίσια του μαθήματος «Τεχνολογίες Ιστού και Ανάλυση Δεδομένων» με καθηγητή τον κ. Ταμπούρη Ευθύμιο.
Ο λόγος που επιλέξαμε να ασχοληθούμε με το συγκεκριμένο θέμα είναι λόγω της μοναδικότητας του συγκεκριμένου κοινωνικού δικτύου.

Για το θεωρητικό κομμάτι του άρθρου και της έρευνας ανατρέξαμε στον οδηγό του Διεθνούς Ιδρύματος Ανοιχτής Γνώσης (http://opendatahandbook.org/guide/el/what-is-open-data/), στην πλατφόρμα MyExperiment(http://www.myexperiment.org/about), στο άρθρο De Roure, D., Goble, C. and Stevens, R. (2009) The Design and Realisation of the myExperiment Virtual Research Environment for Social Sharing of Workflows. Future Generation Computer Systems 25, pp. 561-567, καθώς και στις σημειώσεις του μαθήματος
.

Blog Widget by LinkWithin