Text Mining

Περίληψη—Η ανάγκη για επεξεργασία των πληροφοριών που μας είναι διαθέσιμες, οδήγησε τα τελευταία χρόνια, στην ανάπτυξη ποικίλων διαδικασιών για τον σκοπό αυτό. Οι διαδικασίες αυτές, χρησιμοποιούνται για να μετατρέψουν τις διαθέσιμες πληροφορίες σε μία μορφή, που θα είναι χρήσιμη για τον χρήστη. Είναι επιθυμητό να παραχθεί γνώση, η οποία θα είναι κατανοητή, αξιοποιήσιμη και εύκολη στην χρήση της. Λόγω του ότι τα διαθέσιμα δεδομένα, είναι έγγραφα κειμένου, έχουν αναπτυχτεί διαδικασίες επεξεργασίας τους, που καλύπτονται από τον γενικό όρο Text Mining. Γενικά, οι διαδικασίες αυτές συνοψίζονται στις: κατηγοριοποίηση κειμένων, ταξινόμηση και ομαδοποίηση κειμένων, επεξεργασία φυσικής γλώσσας, περίληψη κειμένου, εύρεση προτύπων συσχέτισης, εύρεση θεμάτων και εξαγωγή πληροφορίας. Τέλος, η υλοποίηση ενός αλγορίθμου περίληψης κειμένων, αποδεικνύει την δυναμική των μεθόδων Text Mining.