Aller au contenu

Traitement Automatique De Documents


rodo37

Messages recommandés

Bonjour,

Actuellement je pense à créer un système de classement automatisé de documents.

Le principe

Vous scannez vos documents (Factures, Notes, Devis, etc...) et vous les envoyés directement par

  1. Email
  2. Serveur FTP

Ensuite, un logiciel traite vos documents, qu'ils soient en images ou PDF, une fois traité, le programme crée des PDF (avec fonctions recherche) et les classes en dossiers et sous dossiers et les envoies sur un NAS.

Questions

Seriez-vous intéressé par un tel système ?

Si oui, voyez-vous une fonction ou une idée en plus ?

Lien vers le commentaire
Partager sur d’autres sites

Ça serait très intéressant d'avoir de l'OCR sur un NAS Synology.

J'avais déjà creusé l'idée et on se rend vite compte de la complexité de l'automatisation.

Il faut déjà choisir un logiciel de reconnaissance de caractères pour traiter les documents numérisés (Tesseract ?) et le paramétrer correctement afin que les résultats de l'OCR soient suffisamment fiables (c'est la partie la plus complexe).

Pour la reconnaissance du document, il faudrait idéalement pouvoir définir une zone précise d'un document (encadré) contenant le texte permettant d'identifier le type de document (nom de l'opérateur mobile, du fournisseur d'électricité, ...). Ça permet de limiter l'OCR à une petite partie de l'image et de classer très rapidement un document. Certains éditeurs vont même jusqu'à reconnaître les logos.

Une fois le document classé, il est possible d'effectuer un OCR complet pour l'indexation.

Plus tard (beaucoup plus tard) on peut étendre la reconnaissance des zones en créant des modèles (un par type de document) afin d'extraire diverses informations du document (dates, montants, ...), et même reconnaître des zones répétées pour traiter des listes.

Sinon il existe aussi des applications sur smartphone qui font de l'OCR à partir d'un document photographié, reste à savoir lesquelles sont capables d'envoyer le document+OCR via FTP (ou autre).

C'est à proposer à Synology comme amélioration de DS File.

Lien vers le commentaire
Partager sur d’autres sites

  • 3 semaines après...
  • 4 ans après...

Bonjour,

je relance le sujet qui date de 2015, je suis effectivement à la recherche de cette solution discutée précédemment (tous mes docs scannés sont sauvés directement en pdf sur le Nas et je cherche a faire en auto dessus de l'ocr pour les recherches...).

Est-ce que depuis 4 ans, certains d'entre vous ont trouvé des solutions, ou créé des scripts ?

Merci d'avance !

Phil

Lien vers le commentaire
Partager sur d’autres sites

Bonjour,

Perso j’utilise la solution devonthink pro office (mac) qui permet de facilement gérer la base documentaire.
Maintenant, sans c’est possible, car mes scans sont automatiquement réalisés en pdf ocr et stockés sur le Nas.

Outre la solution logicielle citée, on tire avantage de Universal Search qui scrute le dossier où sont ces fameux pdf et c’est pratique et rapide pour récupérer une info.




Envoyé de mon iPad en utilisant Tapatalk

Lien vers le commentaire
Partager sur d’autres sites

Merci Daffy!

Effectivement le mieux serait que mes scans soient automatiquement fait en pdf ocr (c'est votre scanner qui gere ca ?)

j'etais plus parti pour trouver une solution qui tourne sur le NAS en arriere plan. En continuant mes recherches j'ai trouvé : tesseract-OCR . je vais voir plus loin ce que ca donne,

Je vais aussi regarder universal search de ce pas.

Merci !

Phil

 

 

 

 

Lien vers le commentaire
Partager sur d’autres sites

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

×
×
  • Créer...

Information importante

Nous avons placé des cookies sur votre appareil pour aider à améliorer ce site. Vous pouvez choisir d’ajuster vos paramètres de cookie, sinon nous supposerons que vous êtes d’accord pour continuer.