Vous avez scanné une page et vous souhaitez extraire son texte, pour cela, vous devez utiliser un logiciel OCR. Si vous n'en n'avez pas sous la main, vous pouvez utiliser le service en ligne gratuit Free OCR qui vous permettra aussi de récupérer le texte des fichiers PDF.
Cliquez sur "Menu > Fichier > Ouvrir". Sélectionnez le fichier PDF que vous souhaitez importer dans OpenOffice et cliquez sur "OK".
Ouvrez votre fichier scanné. Appuyez ensuite sur CTRL+A afin de sélectionner tout puis sur CTRL+C pour copier. Cette commande lancera la reconnaissance de texte. Ouvrez ensuite une page Word vierge et appuyez sur CTRL+V pour coller le contenu.
Modification d'un texte dans un document numérisé
Ouvrez le fichier PDF numérisé dans Acrobat. Sélectionnez Outils > Modifier le fichier PDF. Acrobat applique automatiquement la reconnaissance optique des caractères à votre document et le convertit en copie entièrement modifiable du fichier PDF.
Pour convertir l'écriture manuscrite en texte, procédez comme suit : Sous l'onglet Dessiner, sélectionnez le bouton Sélection par lasso. Dans la page, faites glisser une sélection sur l'écriture manuscrite à convertir. Sous l'onglet Dessiner, sélectionnez le bouton Entrée manuscrite en texte.
Pour convertir un PDF en document Microsoft Word, suivez ces étapes simples : Cliquez sur le bouton Sélectionner un fichier ci-dessus ou faites glisser un fichier dans la zone de dépôt. Sélectionnez le fichier PDF à convertir en DOCX. Acrobat convertit automatiquement le PDF au format Word.
C'est une méthode très simple. Pour convertir le PDF en Word, il suffit de téléverser le fichier dans Google Drive. Ensuite, ouvrez-le dans Google Docs et voyez la magie s'opérer sous vos yeux. Google Docs va transformer automatiquement le PDF en document texte éditable.
Dans le menu, cliquez sur Fichier puis Ouvrir… Sélectionnez le fichier PDF à éditer depuis la fenêtre de dialogue ouverte par LibreOffice puis cliquez sur le bouton Ouvrir en bas à droite. Le document PDF sera alors ouvert pour édition dans LibreOffice Impress.
Les meilleurs logiciels OCR gratuits
LightPDF est un service OCR en ligne qui permet de convertir en quelques clics un document ou une image en un fichier éditable. Sa formule OCR Basic est entièrement gratuite.
La reconnaissance optique de caractères (OCR) est le processus permettant de convertir une image de texte en format de texte lisible par une machine. Par exemple, si vous scannez un formulaire ou un ticket de caisse, votre ordinateur enregistre la numérisation en tant que fichier image.
Comment convertir PDF scanné en Word
Ouvrez un PDF image dans Able2Extract. Cliquez sur l'icône Word sous l'onglet Conversion. Enregistrez votre fichier converti en cliquant sur le bouton Enregistrer.
Allez simplement dans l'onglet « Éditer » afin de pouvoir éditer n'importe quel type de texte ou d'image de votre document PDF. Lorsque vous voulez éditer du texte, cliquez sur le bouton « Éditer du texte » et cliquez ensuite sur le texte que vous voulez éditer.
ILovePDF est un outil d'édition PDF gratuit qui vous permet de modifier des fichiers PDF en ligne. Avec iLovePDF vous pouvez ajouter du texte, des images et des flèches sur vos documents.
OCR – Reconnaissance optique de caractères - La technologie OCR permet de convertir un texte manuscrit en un texte éditable et consultable sur votre ordinateur. Vous pouvez utiliser l'OCR sur des PDF scannés ou des PDF à base d'images mais aussi sur des textes écrits à la main afin d'en numériser le contenu.
Un réécrivain, également connu sous le nom de machine de paraphrase, de réécriture de paragraphe ou de réécriture de texte, est une machine qui reformule une phrase ou un paragraphe en modifiant la séquence de mots, en utilisant d'autres mots pertinents ou en ajoutant un contexte supplémentaire.
Une fois l'image insérée, cliquez avec le bouton droit de la souris et sélectionnez l'option Copier le texte de l'image. Le texte est désormais copié dans le Presse-papiers et il suffit maintenant de le coller dans un éditeur de texte, tel que le Bloc-notes ou Microsoft Word.
Sélectionnez Outils > Numérisation et OCR > Améliorer > Document numérisé. Sélectionnez des options dans la barre d'outils secondaire. Cliquez sur l'icône Paramètres , choisissez les options adéquates dans la boîte de dialogue Améliorer le fichier PDF numérisé, puis cliquez sur OK.
Il faut utiliser un logiciel de reconnaissance optique (connu sous le nom d'OCR) pour transformer le résultat d'un scan qui est une image, en un fichier de données qui comprend les caractères reconnus et éventuellement la mise en page.
Ouvrez le document que vous souhaitez publier au format PDF puis cliquez sur le bouton Office en haut à gauche de l'écran pour sélectionner Enregistrer sous puis PDF ou XPS. Dans la boîte de dialogue qui s'affiche, sélectionnez PDF dans le menu déroulant Type, nommez votre fichier puis cliquez sur Publier.