| |
|
ACCUEIL - Liens
- Informatique - ocr
Reconnaissance optique de caractères (OCR):
A proprement parler, ce ne sont pas les scanners qui effectuent les tâches
de reconnaissance de caractère. Le scanner se contente de numériser
le document contenant le texte. C'est un logiciel spécialisé,
appelé logiciel d'OCR (Optical Character Recognition) qui permettra
de sélectionner des sections de texte à numériser
(masques) et qui convertira les images correspondantes en texte.
Même si les progrès réalisés depuis quelques
années sont étonnants, il faudra suivre quelques règles
simples pour obtenir du texte exploitable :
-
Ne pas numériser de document où le texte est peu contrasté
par rapport au papier. Donc éviter les papiers colorés
sombres.
-
Numériser des textes parfaitement imprimés, sans bavures
ou liaisons entre lettres.
-
Numériser avec une résolution d'au moins 300 dpi en
noir & blanc.
-
Choisir pour les caractères non identifiés - il y
en a toujours - un caractère qui provoquera à coup sûr
une réaction de votre correcteur orthographique, par exemple
"§".
Différents logiciels comme Image-In Read, TextBridge, Omnipage,
etc... sont livrés directement avec le scanner.
Comment procéder avec TextBridge ?
-
Placer correctement le document dans le scanner ;
-
Lancer l'application Word et créer un nouveau document ;
-
Menu Fichier-Textbridge ;
-
La fenêtre de description ci-dessous apparaît
;
-
Sélectionner le type de page qui correspond à
votre original ;
-
Lisez la description qui apparaît dans la partie
inférieur de la boîte de dialogue Démarrer
pour vérifier que le type de page sélectionné
correspond bien à votre original ;
-
Sélectionnez la source de la page : le scanner
ou un fichier image existant ;
-
Sélectionner le mode de traitement automatique
ou manuel, puis cliquer sur OK ;
|
 |
-
La fenêtre ci-contre permet de configurer les paramètres
du scanner ;
-
Choisir le type d'image : Au trait/OCR ;
-
Choisir la destination : OCR ;
-
Choisir une résolution minimale de 300 dpi .
-
Dans la partie Aperçu, le bouton
permet d'effectuer un prescan de toute la page ;
-
le second bouton ,
permet d'afficher la sélection effectuée au
moyen de la souris
-
Cliquer sur Numériser. Dès que TextBridge
a traité la page, le logiciel la colle dans le document
ouvert, à l'emplacement du curseur.
-
Ne pas oublier de passer le vérificateur orthographique,
car des erreurs de reconnaissance ne sont pas impossibles
|
|
| Télécharger
le document pdf - 176 Ko |
pth - novembre 2003
|
|