ACCUEIL - Liens - Informatique - ocr

Reconnaissance optique de caractères (OCR):

A proprement parler, ce ne sont pas les scanners qui effectuent les tâches de reconnaissance de caractère. Le scanner se contente de numériser le document contenant le texte. C'est un logiciel spécialisé, appelé logiciel d'OCR (Optical Character Recognition) qui permettra de sélectionner des sections de texte à numériser (masques) et qui convertira les images correspondantes en texte.

Même si les progrès réalisés depuis quelques années sont étonnants, il faudra suivre quelques règles simples pour obtenir du texte exploitable :

  • Ne pas numériser de document où le texte est peu contrasté par rapport au papier. Donc éviter les papiers colorés sombres.

  • Numériser des textes parfaitement imprimés, sans bavures ou liaisons entre lettres.

  • Numériser avec une résolution d'au moins 300 dpi en noir & blanc.

  • Choisir pour les caractères non identifiés - il y en a toujours - un caractère qui provoquera à coup sûr une réaction de votre correcteur orthographique, par exemple "§".

Réf. : http://www.ac-poitiers.fr/pedago/outil/astuces/media/imag_num/scanners.htm

Différents logiciels comme Image-In Read, TextBridge, Omnipage, etc... sont livrés directement avec le scanner.

 

Comment procéder avec TextBridge ?

  • Placer correctement le document dans le scanner ;

  • Lancer l'application Word et créer un nouveau document ;

  • Menu Fichier-Textbridge ;

  • La fenêtre de description ci-dessous apparaît ;

  • Sélectionner le type de page qui correspond à votre original ;

  • Lisez la description qui apparaît dans la partie inférieur de la boîte de dialogue Démarrer pour vérifier que le type de page sélectionné correspond bien à votre original ;

  • Sélectionnez la source de la page : le scanner ou un fichier image existant ;

  • Sélectionner le mode de traitement automatique ou manuel, puis cliquer sur OK ;

  • La fenêtre ci-contre permet de configurer les paramètres du scanner ;

  • Choisir le type d'image : Au trait/OCR ;

  • Choisir la destination : OCR ;

  • Choisir une résolution minimale de 300 dpi .

  • Dans la partie Aperçu, le bouton permet d'effectuer un prescan de toute la page ;

  • le second bouton , permet d'afficher la sélection effectuée au moyen de la souris

  • Cliquer sur Numériser. Dès que TextBridge a traité la page, le logiciel la colle dans le document ouvert, à l'emplacement du curseur.

  • Ne pas oublier de passer le vérificateur orthographique, car des erreurs de reconnaissance ne sont pas impossibles

 
Télécharger le document pdf - 176 Ko
pth - novembre 2003