Guide de l'utilisateur
Nitro PDF Mac

OCR (reconnaissance optique de caractères)

Utilisation de l'OCR dans Nitro PDF Pro

L'OCR (Optical Character Recognition) est le processus de conversion d'une image bitmap de texte (comme un document numérisé) en texte pouvant être sélectionné, copié et recherché par Nitro PDF Pro et d'autres logiciels d'édition de texte. Une fois le texte reconnu par OCR, il est placé sur un calque invisible au-dessus de l'image du texte que vous pouvez voir. Lorsque vous copiez du texte, le texte est copié à partir de ce calque OCR invisible. La technologie OCR ne produira pas un rendu parfait du texte bitmap. Vous devrez relire et modifier le texte résultant de l'OCR.

OCR automatique

  1. Ouvrez un PDF numérisé dans Nitro PDF Pro.
  2. Une boîte d'alerte s'ouvre avec le message :
    "Ce document semble être numérisé. Souhaitez-vous effectuer une reconnaissance optique de caractères (OCR) dessus ? OCR vous permettra de sélectionner le texte."
  3. Vous avez trois options :
  • Annuler : Aucun OCR ne sera effectué.
  • OCR Page : L'OCR sera exécuté sur la page actuelle.
  • Document OCR : Si votre document comporte plusieurs pages, l'OCR sera effectué sur toutes les pages.

Choisissez les langues reconnues par OCR dans Préférences > OCR. ( Préférences utilisateur ).

Pendant que Nitro PDF Pro effectue l'OCR, une barre de progression apparaît. L'opération peut prendre quelques secondes ou beaucoup plus, selon la taille et le contenu du document numérisé.

ROC manuelle

Pour effectuer l'OCR manuellement, choisissez Edition > Page OCR. Nitro PDF Pro commence à effectuer l'opération OCR et la barre de progression apparaît.

Forcer l'OCR

Nitro PDF Pro examine le document et s'il voit une image de la taille d'une page, il suppose que le document est une numérisation et propose automatiquement d'effectuer l'OCR. Dans certains cas, Nitro PDF Pro peut ne pas reconnaître un document numérisé. Dans le menu Edition, la page OCR sera grisée et indisponible pour la sélection.

  1. Maintenez les touches Commande et Option enfoncées ensemble.
  2. Choisissez Édition > Page OCR dans le menu.

OCR par lot

(Fonctionnalité avancée de Nitro PDF Pro). Voir OCR par lot .

Conseils pour améliorer les résultats de l'OCR

  • La qualité du document original affecte la qualité des performances de l'OCR. Des originaux nets et nets avec du texte clair produiront de bien meilleurs résultats que des photocopies froissées et décolorées.
  • Placez votre document original sur le scanner aussi droit que possible. Si vous avez une page numérisée qui n'est pas droite, vous pouvez « redresser », ou redresser, l'image dans Nitro PDF Pro en choisissant Édition > Redresser et ajuster l'image
  • Augmentez le contraste de votre document numérisé afin que l'arrière-plan soit aussi blanc que possible. Vous pouvez régler le contraste de l'image en choisissant Édition > Redresser et ajuster l'image

Dictionnaires et OCR

Des dictionnaires médicaux et juridiques sont inclus dans le moteur OCR de Nitro PDF Pro pour améliorer la qualité de la sortie OCR des documents numérisés en reconnaissant des mots spécifiques aux professions médicales et juridiques. Cette fonctionnalité est intégrée, il n'est donc pas nécessaire d'activer ou de régler un paramètre. Si vous choisissez de modifier le texte OCR, les mots mal orthographiés pour le texte sélectionné peuvent être affichés avec un soulignement ondulé rouge.

Tags
Nitro PDF Mac Modification de PDF