OCR
l’OCR peut même s’effectuer en ligne, ici avec i2OCR (Crédit totumweb.com) Pour Optical Character Recognition, est un procédé de reconnaissance optique de caractère mise en oeuvre, le plus souvent, au moyen d’un scanner, fixe ou mobile, voir d’un smartphone.
Pour ménager les manuscrits très anciens, d’autres matériels de numérisation existent, comme des appareils de photo sophistiqués capables de multiplier les prises de vue sous plusieurs angles sans toucher le fragile sujet.
Dans tous les cas, et quelques soit le procédé d’acquisition, la technique OCR repose sur la numérisation d’un texte (par exemple une feuille volante) pour en extraire une photo très contrastée puis, grâce à des algorithmes spéciaux, à la transformer en un document texte éditable à volonté.
Plusieurs logiciels sont spécialisés dans ce délicat procédé de reconnaissance. Certains sont plus orientés vers l’archivage numérique, d’autres vers la traduction et la correction. Tous obtiennent de meilleurs résultats à partir d’un original de qualité correcte, si possible encore disponible physiquement, car l’OCR n’est pas très efficace sur une simple photographie de texte obtenue précédemment.
Enfin, si la reconnaissance d’un texte manuscrit au moyen de l’OCR existe, elle est encore aléatoire et dépend beaucoup de la qualité de l’écriture, de son degré de lisibilité notamment.