Το έργο OAVA στοχεύει στη δημιουργία μιας πλατφόρμας ενοποιημένης μηχανής αναζήτησης σε οπτικοακουστικό υλικό ανοικτής πρόσβασης βασισμένη σε βιβλιοθηκονομικά πρότυπα τεκμηρίωσης, η οποία θα παρέχεται δωρεάν προς το κοινό. Για την ανάπτυξη της πλατφόρμας θα πραγματοποιηθεί συλλογή δεδομένων εκπαίδευσης, ο σχεδιασμός και η εκπαίδευση μοντέλων βαθιάς μάθησης για την ανάπτυξη αλγορίθμων αυτόματης αναγνώρισης ομιλίας στα ελληνικά και αγγλικά. Θα αξιοποιηθεί η υπάρχουσα τεχνολογία, η τεχνογνωσία στην ανάλυση και επεξεργασία οπτικοακουστικών ροών της DataScouting, τα επιστημονικά παράγωγα αναγνώρισης λόγου αυτού του έργου και η μακρόχρονη εμπειρία του Τμήματος Βιβλιοθηκονομίας, Αρχειονομίας και Συστημάτων Πληροφόρησης στην τεκμηρίωση υλικού και στην οργάνωση πληροφοριών και της γνώσης.

Η πλατφόρμα θα επιτρέπει την αναζήτηση οπτικοακουστικών αρχείων αξιοποιώντας τόσο τα μεταδεδομένα που διατίθενται από τους φορείς παραγωγούς/διάθεσης των οπτικοακουστικών αρχείων, όσο και το πλήρες κείμενο που προκύπτει από την αυτόματη αναγνώριση ομιλίας.

Μέρος του έργου υλοποιήθηκε με βάση το μοντέλο EBUCore, το οποίο είναι ένα καθιερωμένο πρότυπο στον τομέα των οπτικοακουστικών μεταδεδομένων. Το EBUCore δημοσιεύεται με Creative Commons “Attribution-Non-Commercial-ShareAlike3.0 Unported (CC BY-NC-SA 3.0)” και οι χρήστες του έχουν τη δυνατότητα να το αλλάξουν ανάλογα με τις ανάγκες τους.

Πακέτα εργασίας

Δημιουργία Δεδομένων Εκπαίδευσης

Δημιουργία ενός συνόλου δεδομένων εκπαίδευσης (μεταγραφής σε κείμενο ακουστικών ροών στα ελληνικά με χρονική επισήμανση) και ανάπτυξη εμπορικού αρθρώματος αυτόματης αναγνώρισης λόγου στα αγγλικά και στα ελληνικά με αξιοποίηση της τρέχουσας και υπάρχουσας τεχνολογικής στάθμης και με ακρίβεια αντίστοιχης των εμπορικών ανταγωνιστικών προϊόντων. Καταγραφή μεθοδολογιών εκπαίδευσης και επέκτασης των μοντέλων αναγνώρισης λόγου και σε άλλες γλώσσες.

Καταγραφή οπτικοακουστικού υλικού

Καταγραφή των πηγών ελληνόγλωσσου οπτικοακουστικού υλικού ανοικτής πρόσβασης, προσαρμογή του κατάλληλου σχήματος μεταδεδομένων σύμφωνα με τα διεθνή πρότυπα της βιβλιοθηκονομίας και επιστήμης της πληροφόρησης, προτυποποίηση του μοντέλου τεκμηρίωσης και διαδικασία ημι-αυτόματης ευρετηρίασης με φυσική γλώσσα από το διαθέσιμο διαδικτυακά οπτικοακουστικό υλικό αξιοποιώντας τη μακρόχρονη εμπειρία των αρχειονόμων-βιβλιοθηκονόμων μελών της ερευνητικής ομάδας.

Πλατφόρμα οπτικοακουστικού υλικού

Λογισμικό περιηγητή αποθετηρίων με στόχο την προσωρινή μεταφόρτωση των ψηφιακών αντικειμένων, την επεξεργασία τους απο το άρθρωμα αναγνώρισης λόγου και την εξαγωγή του κειμένου, την αποθήκευση του κειμένου και των μεταδεδομένων τους, τον εμπλουτισμό του διαδικτύου με με ελληνικό περιεχόμενο σε αναζητήσιμη μορφή, καθώς και τη διάθεση στο κοινό μέσω μιας ενοποιημένης μηχανής αναζήτησης ανοικτού κώδικα.

Καινοτομία Ερευνητικού Έργου

Το παρόν ερευνητικό έργο στοχεύει στη μελέτη, σχεδίαση και ανάλυση ερευνητικής παραγωγής ανοιχτού κώδικα  με σκοπό την υλοποίηση ολοκληρωμένων μοντέλων αναγνώρισης ομιλίας στα αγγλικά αλλά και στα ελληνικά. Το έργο θα επικεντρωθεί στην αξιοποίηση της βιβλιοθήκης DeepSpeech που κατασκευάστηκε από την εταιρεία Mozilla και βασίζεται στο “Baidu’s Deep Speech research paper”. Πρόκειται για λογισμικό ανοικτού κώδικα που πραγματοποιεί την διαδικασία της μάθησης κάνοντας χρήση του TensorFlow framework.

Φορείς Υλοποίησης

Διεθνές Πανεπιστήμιο της Ελλάδος

Το Τμήμα Βιβλιοθηκονομίας, Αρχειονομίας και Συστημάτων Πληροφόρησης (πρώην Τμήμα ΒΙβλιοθηκονομίας και Συστημάτων Πληροφόρησης του ΑΤΕΙ Θεσσαλονίκης) ιδρύθηκε το 1984 και έκτοτε στεγάζεται στη περιοχή της Σίνδου στη Θεσσαλονίκη. Σκοπός του Τμήματος αποτελεί η προαγωγή της Βιβλιοθηκονομίας, της Αρχειονομίας και της Επιστήμης της Πληροφόρησης, καθώς και η άρτια επιστημονική κατάρτιση στελεχών, που θα απασχοληθούν σε βιβλιοθήκες όλων των ειδών, κέντρα πληροφόρησης, καθώς και σε αρχειακούς φορείς.

DataScouting

Η DataScouting είναι εταιρεία ανάπτυξης λογισμικού και τεχνολογικών υπηρεσιών Πληροφορίας και Επικοινωνιών με εξειδίκευση στη δημιουργία καινοτόμων λύσεων για παρακολούθηση μέσων μαζικής ενημέρωσης και διαχείριση/ανάλυση πληροφορίας σε βιβλιοθήκες και αρχεία.

Νέα / Ανακοινώσεις

Ολοκλήρωση παραδοτέου Π3.1.1.

Πρώιμη έκδοση λογισμικού ενοποιημένης μηχανής αναζήτησης, μεταφόρτωσης, επεξεργασίας και τεκμηρίωσης οπτικοακουστικών ροών

16/10/2021

Mapping audiovisual content providers and resources in Greece

Το άρθρο με τίτλο Mapping audiovisual content providers and resources in Greece έγινε αποδεκτό για δημοσίευση στο International Journal on Digital Libraries (eISSN:1432-1300). Αυτό το άρθρο παρουσιάζει τα αποτελέσματα της χαρτογράφησης δημιουργών και παρόχων οπτικοακουστικού υλικού στην Ελλάδα η οποία εκτελέστηκε στο πλαίσιο του έργου. Βιβλιοθήκες, αρχεία, μουσεία, πανεπιστήμια, οργανισμοί μέσων μαζικής ενημέρωσης, κυβερνητικές και μη κυβερνητικές οργανώσεις αποτελούν τους κύριους τύπους παρόχων.

09/10/2021

Ολοκλήρωση παραδοτέου Π2.3.1.

Άρθρωμα αυτόματης αναγνώρισης λόγου για τα αγγλικά και καταγραφή μεθοδολογιών εκπαίδευσης

16/08/2021

Ολοκλήρωση παραδοτέου Π2.2.1.

Έκθεση εργασιών επισήμανσης του συνόλου δεδομένων εκπαίδευσης Σκοπός του παρόντος εγγράφου αποτελεί η καταγραφή των εργασιών χειροκίνητης επισήμανσης ακουστικών ροών και συγκεκριμένα η απομαγνητοφώνηση τους. Το συγκεκριμένο παραδοτέο είναι ιδιαίτερα σημαντικό καθώς η ποιότητα του μοντέλου αυτόματης αναγνώρισης ομιλίας των ελληνικών βασίζεται κατά κύριο λόγο στον όγκο και στην ποιότητα του συνόλου δεδομένων που θα δημιουργηθεί.

16/08/2021

Ολοκλήρωση παραδοτέου Π2.1.1.

Έκθεση εργασιών καταγραφής πηγών και μεθοδολογίας και σχήματος τεκμηρίωσης Σκοπός του παρόντος εγγράφου είναι να παρουσιάσει τις εργασίες καταγραφής των πηγών και το σχήμα τεκμηρίωσης που θα χρησιμοποιηθεί στο έργο. Όσον αφορά στις εργασίες καταγραφής θα παρουσιαστούν τα κριτήρια επιλογής των πηγών, η ροή εργασίας κατά την επιλογή κριτηρίων και πηγών και ο τελικός κατάλογος με τις επιλεγμένες πηγές. Όσον αφορά στο σχήμα τεκμηρίωσης, αρχικά θα παρουσιαστεί η μελέτη σχημάτων τεκμηρίωσης, το σχήμα τεκμηρίωσης του έργου OAVA και παραδείγματα αντιστοίχισης των αρχικών μεταδεδομένων των πηγών στο σχήμα του OAVA.

16/03/2021

Ολοκλήρωση παραδοτέου Π1.2.1.

Έκθεση αρχιτεκτονικής και προδιαγραφών συστήματος Σκοπός του παρόντος εγγράφου είναι να περιγράψει και να καταγράψει τις τεχνικές λεπτομέρειες υλοποίησης και διασύνδεσης όλων των υποσυστημάτων έρευνας και λογισμικού του έργου.

16/10/2020

Ολοκλήρωση παραδοτέου Π1.1.1.

Προσδιορισμός Απαιτήσεων Χρηστών Σκοπός του παρόντος εγγράφου είναι να περιγράψει και να καταγράψει τους στόχους των χρηστών και τις λειτουργίες που θα εκτελούνται με τη χρήση του λογισμικού. Η καταγραφή των απαιτήσεων χρηστών διευκολύνει τη διατύπωση του προβλήματος, προωθεί την ομαλή ανάπτυξη του λογισμικού και διασφαλίζει την επιτυχία του εγχειρήματος.

16/09/2020

Malliari, A., Nitsos, I., Zapounidou, S. Doropoulos, S. (2022).

Mapping audiovisual content providers and resources in Greece. International Journal on Digital Libraries.
https://doi.org/10.1007/s00799-022-00321-6

03/02/2022

Malliari, A., Nitsos, I., Zapounidou, S. Doropoulos, S. (2022).

Development of an audio-visual aggregator: the Open Audio-Visual Archives (OAVA) project in Greece. Trends and Issues in Library Technology, Special Artificial Intelligence Issue, June 2022: 26-31.
https://repository.ifla.org/handle/123456789/1940

June 2022

Malliari, A., Nitsos, I., Zapounidou, S. Doropoulos, S. (2022).

Copyright implications for the aggregation of audiovisual content in Greece. Digital Library Perspectives, In Press.

17/06/2022