A Bayesian network model for stochastic tagging of natural language texts

Part of : Εφαρμοσμένη γλωσσολογία ; No.19, 2003, pages 63-81

Issue:
Pages:
63-81
Author:
Abstract:
Αυτή η εργασία εισάγει και αξιολογεί ένα μοντέλο δικτύων Bayes για την αυτόματη επισημείωση μερών του λόγου σε λέξεις Νέων Ελληνικών κειμένων, γραμμένων σε φυσική γλώσσα. Το μοντέλο εκπαιδεύεται από επισημειωμένα κείμενα χρησιμοποιώντας λεξική και περικειμενική πληροφορία. Σε αντίθεση με την πλειοψηφία των υπαρχόντων επισημειωτών, χρησιμοποιεί ελάχιστους γλωσσολογικούς πόρους και συγκεκριμένα ένα μικρό λεξικό άκλιτων λέξεων και λέξεων που ανήκουν σε κλειστά μέρη του λόγου, καθώς και ένα λεξικό περίπου 150 καταλήξεων. Επιπλέον, το μοντέλο έχει επεκταθεί για να βγάζει συμπέρασμα για την γραμματική πτώση μιας άγνωστης λέξης. Τα πειραματικά αποτελέσματα δείχνουν ακρίβεια 91-96% για το μέρος του λόγου και 93-97% για την επισημείωση της γραμματικής πτώσης.
Subject:
Subject (LC):
Notes:
Περιέχει πίνακες, διαγράμματα και βιβλιογραφία