Logo
Banner

Το Έργο

Το έργο έχει ως βασικό στόχο τη δημιουργία μιας καινοτόμου πληροφοριακής εφαρμογής αυτοματοποιημένης αναγνώρισης, ανάλυσης, επισήμανσης και εμπλουτισμού τεκμηρίων που θα δίνει την ευκαιρία σε οργανισμούς και βιβλιοθήκες να εμπλουτίσουν με ελάχιστο κόπο το ήδη ψηφιοποιημένο τους υλικό με επιπλέον μεταδεδομένα, βελτιώνοντας έτσι την διαλειτουργικότητα, την επαναχρησιμοποίηση αλλά και την βέλτιστη διάθεσή του στο ευρύτερο κοινό αλλά και στον εξειδικευμένο ερευνητή. Ταυτόχρονα ενισχύει τη γνώση που υπάρχει σε ψηφιοποιημένη μορφή στα ηλεκτρονικά ράφια πολιτισμικών οργανισμών, με την χρήση της επιστήμης της πληροφορικής, προτύπων και διαδικασιών digital humanities, προτείνοντας μια ολοκληρωμένη λύση που απευθύνεται τόσο σε Ελλάδα αλλά και στο εξωτερικό.

Στόχος του έργου είναι η ανάπτυξη ενός ολοκληρωμένου Software as a Service (SaaS) εργαλείου που θα δέχεται σαν είσοδο ψηφιοποιημένα τεκμήρια και θα τα εμπλουτίζει αυτόματα, παράγοντας XML αρχεία σύμφωνα με το διεθνές πρωτόκολλο κωδικοποίησης κειμένων TEI (Text Encoding Initiative, ISO/IEC 24610-1:2006), τα οποία ενσωματώνουν τόσο δομική όσο και σημασιολογική πληροφορία. Η αρχική είσοδος στο σύστημα θα είναι ψηφιοποιημένα τεκμήρια κειμένου σε διαφορετικές μορφές (π.χ. TIFF, JPEG, PDF) ενώ η τελική έξοδος θα είναι ηλεκτρονικά αρχεία που θα περιέχουν όλες τις πληροφορίες όπως αρχεία περιγραφής ΤΕΙ XML, τα οποία θα είναι διαθέσιμα τόσο για ανάκτηση όσο και για διόρθωση. Το SaaS εργαλείο θα είναι προσβάσιμο τόσο από web user interface όσο και μέσω από προγραμματιστική διεπαφή (API) ενώ ο χρήστης θα μπορεί να αγοράζει πακέτα χρήσης τα οποία θα αναλώνονται σε συγκεκριμένα έργα (tasks).

Θα χρησιμοποιηθούν τεχνικές μηχανικής ευφυΐας για την αυτόματη εξαγωγή οντοτήτων όπως κύρια ονόματα, τοπωνύμια αλλά και την εξόρυξη γνώσης από το κείμενο μέσω αυτόματης σημασιολογικής ανάλυσης κειμένου αλλά και της διασύνδεσης των εννοιών/θεμάτων του κάθε κειμένου με ήδη υφιστάμενες οντολογίες. Ταυτόχρονα θα γίνει βελτιστοποίηση της μηχανής αναγνώρισης χαρακτήρων εκπαιδεύοντας το εμπορικό πακέτο της Abbyy Finereader αλλά και ενσωματώνοντας μηχανές ανοιχτού λογισμικού.

Τέλος για την εκπαίδευση αλλά και την επαλήθευση των ερευνητικών αποτελεσμάτων θα γίνει κωδικοποίηση μέρους της συλλογής Τρικόγλου, μιας πολύ σημαντικής συλλογής της βιβλιοθήκης του ΑΠΘ.

Logo

Αξιοποίηση πολιτισμικού αποθέματος με τη χρήση υποβοηθούμενης αναγνώρισης, ανάλυσης, επισήμανσης και εμπλουτισμού τεκμηρίων.

Ακολουθήστε μας

Copyright © 2018 - 2019 ECARLE. All rights reserved.

Μετάβαση στο περιεχόμενο