J'ai de vieux documents datant de 18xx en jpeg, assez miteux, que je souhaiterais "traduire" (si autant que ce soit est possible...)et à convertir en PDF
Une idée d'app ?
Bonne application OCR ?
-
- Membre
- Messages : 10074
- Enregistré le : 10 nov. 2017, 21:50
- Score de réactions : 43
Bonne application OCR ?
Parabole Triax Multifeed 4 LNB + DAB+ RTL2832U R820T2 + CI Module
Voo HFC (anciennement : EDPnet VDSL XL - Brutele - RealRoot - Scarlet)
Main O.S : Debian Bookworm / FreeBSD 14.2 aarch64
Raspberry Pi 4 + NAS / DietPi v9.11
Server : ubuntu Noble Numbat 24.04
Voo HFC (anciennement : EDPnet VDSL XL - Brutele - RealRoot - Scarlet)
Main O.S : Debian Bookworm / FreeBSD 14.2 aarch64
Raspberry Pi 4 + NAS / DietPi v9.11
Server : ubuntu Noble Numbat 24.04
-
- Membre
- Messages : 5288
- Enregistré le : 09 avr. 2018, 12:29
- Score de réactions : 51
- Localisation : Triangle BFL
- Âge : 75
Bonne application OCR ?
La première chose à voir, si tu veux convertir en texte, c'est la qualité, ce sont des imprimés, des manuscrits ?
Si c'est difficile, il y a des sites qui te font cela en ligne. Si ceux-là ne marchent pas bien, tu devrait te tourner vers Read Iris qui est un logiciel terrible, mais commercial pour Windows et Mac.
En Linux, la bibliothèque est très pauvre et les applications sont très souvent un foreground permettant d'utiliser facilement Tesseract qui est, je crois, le seul module de reconnaissance disponible, mais il est de bonne qualité sans plus.
Si c'est difficile, il y a des sites qui te font cela en ligne. Si ceux-là ne marchent pas bien, tu devrait te tourner vers Read Iris qui est un logiciel terrible, mais commercial pour Windows et Mac.
En Linux, la bibliothèque est très pauvre et les applications sont très souvent un foreground permettant d'utiliser facilement Tesseract qui est, je crois, le seul module de reconnaissance disponible, mais il est de bonne qualité sans plus.
___
CS
CS
-
- Membre
- Messages : 10074
- Enregistré le : 10 nov. 2017, 21:50
- Score de réactions : 43
Bonne application OCR ?
Je te remercie C.S
Effectivement, ce sont des photos d'actes manuscrits que j'ai finalement scanné avec Readiris et utilisé son OCR et ça décolle !
"L'an Mil huit cent vingt-six, ... officier de l'état civil de la commune de ... Grand-Duché de Luxembourg"


Effectivement, ce sont des photos d'actes manuscrits que j'ai finalement scanné avec Readiris et utilisé son OCR et ça décolle !
"L'an Mil huit cent vingt-six, ... officier de l'état civil de la commune de ... Grand-Duché de Luxembourg"
Parabole Triax Multifeed 4 LNB + DAB+ RTL2832U R820T2 + CI Module
Voo HFC (anciennement : EDPnet VDSL XL - Brutele - RealRoot - Scarlet)
Main O.S : Debian Bookworm / FreeBSD 14.2 aarch64
Raspberry Pi 4 + NAS / DietPi v9.11
Server : ubuntu Noble Numbat 24.04
Voo HFC (anciennement : EDPnet VDSL XL - Brutele - RealRoot - Scarlet)
Main O.S : Debian Bookworm / FreeBSD 14.2 aarch64
Raspberry Pi 4 + NAS / DietPi v9.11
Server : ubuntu Noble Numbat 24.04