Εκτύπωση
Γενικά
Καλές Πρακτικές και Πρακτικές Οδηγίες
Σχεδιασμός του έργου ψηφιοποίησης
Επιλογή Περιεχομένου
Προετοιμασία για ψηφιοποίηση
Μεταχείριση των πρωτοτύπων
Ψηφιοποίηση
Διατήρηση του ψηφιακού περιεχομένου
Μεταδεδομένα
Ενέργειες ανάδειξης - προβολής
Πνευματικά Δικαιώματα
Διαχείριση έργων ψηφιοποίησης

Πρότυπα
Πρότυπα κειμένου
Πρότυπα εικόνας
Πρότυπα ήχου
Πρότυπα βίντεο
Πρότυπα τρισδιάστατου περιεχομένου
Πρότυπα μεταδεδομένων
Πρότυπα ταξινόμησης και ονοματολογίας

Τεχνικές Οδηγίες

Κέντρα Αριστείας
Λογισμικό ανάδειξης
καλών πρακτικών

Βήμα Συζητήσεων
Συντελεστές
 Διαδρομή: Αρχική Σελίδα > Γενικά > Ψηφιοποίηση Σύνδεση   
  Οπτική αναγνώριση χαρακτήρων (OCR)
    
 

Σε πολλά έργα περιλαμβάνεται η ψηφιοποίηση εντύπων, όπως βιβλία και εφημερίδες, συνήθως με τη βοήθεια σαρωτή. Η χρήση λογισμικού για την οπτική αναγνώριση χαρακτήρων είναι συνηθισμένη λύση για την εξαγωγή του κειμένου από την ψηφιακή εικόνα και την παροχή δυνατοτήτων για τη μετέπειτα επεξεργασία του. Το λογισμικό OCR αναγνωρίζει τους χαρακτήρες που περιέχονται σε ένα αρχείο εικόνας και στη συνέχεια τους εξάγει σε μορφή αρχείων κειμένου ASCII. Αυτό επιτρέπει ποικίλες διαδικασίες επεξεργασίας, όπως αναζήτηση, αλλαγή τύπου αρχείου κλπ.

Οδηγίες

  • Πριν την επιλογή του λογισμικού OCR που θα χρησιμοποιηθεί από το έργο, καλό είναι να προηγηθεί μια έρευνα αγοράς σχετικά με τα προϊόντα που κυκλοφορούν. Συνήθως οι σαρωτές περιλαμβάνουν και λογισμικό OCR, ωστόσο τα πακέτα με τις περισσότερες δυνατότητες συνήθως πωλούνται ξεχωριστά.
  • Ένα σημαντικό χαρακτηριστικό ενός πακέτου OCR είναι η αναγνώριση και η διόρθωση με το χέρι λαθών και σημείων που δεν κατάφερε να αναγνωρίσει το λογισμικό. Ένα πακέτο που παρέχει φιλική διεπαφή για το χρήστη που αναλαμβάνει τις παραπάνω εργασίες μπορεί να οδηγήσει σε σημαντικά οφέλη από άποψη χρόνου και προσπάθειας.
  • Τα πακέτα OCR έχουν καλύτερα αποτελέσματα σε έγγραφα που βρίσκονται σε καλή κατάσταση. Αντίθετα, η αναγνώριση χαρακτήρων σε ένα έγγραφο τσακισμένο, ξεθωριασμένο και με πτυχώσεις θα έχει περισσότερα λάθη. Για το λόγο αυτό, καλό είναι να προηγείται της ψηφιοποίησης η συντήρηση των εγγράφων, σε όσες περιπτώσεις είναι εφικτό.
  • Για έγγραφα τα οποία δεν είναι σε άριστη κατάσταση ίσως είναι σκόπιμη η χρήση λογισμικού επεξεργασίας εικόνας, ώστε να βελτιωθεί η αντίθεση και να μειωθούν οι αλλοιώσεις στα χρώματα της εικόνας.
  • Καλό είναι να εξακριβωθεί η διαθεσιμότητα λεξικών στη γλώσσα του εγγράφου στο πακέτο OCR.

Σχόλια

Στην αγορά κυκλοφορούν πολλά πακέτα λογισμικού OCR. Κάποια από αυτά διαθέτουν πολύ καλή λειτουργικότητα σε θέματα επεξεργασίας και διόρθωσης λαθών. Για το λόγο αυτό προτιμώνται από τους φορείς που έχουν ασχολούνται με ψηφιοποίηση.

Η αναγνώριση χαρακτήρων σε κείμενα που είναι γραμμένα στην καθαρεύουσα είναι ικανοποιητική στα πιο δημοφιλή πακέτα OCR που κυκλοφορούν στην αγορά.

 
Προηγούμενη Σελίδα    Επόμενη Σελίδα

Εισαγωγή
Τεχνικά Χαρακτηριστικά
Χρήση σαρωτών
Χρήση ψηφιακών φωτογραφικών μηχανών
Τεχνικές και ρυθμίσεις πριν την ψηφιακή αποτύπωση
Επεξεργασία των ψηφιακών αντιγράφων
Οπτική αναγνώριση χαρακτήρων (OCR)
Έλεγχος ποιότητας