Aller au contenu

Traitement Automatique De Documents

Featured Replies

Posté(e)

Bonjour,

Actuellement je pense à créer un système de classement automatisé de documents.

Le principe

Vous scannez vos documents (Factures, Notes, Devis, etc...) et vous les envoyés directement par

  1. Email
  2. Serveur FTP

Ensuite, un logiciel traite vos documents, qu'ils soient en images ou PDF, une fois traité, le programme crée des PDF (avec fonctions recherche) et les classes en dossiers et sous dossiers et les envoies sur un NAS.

Questions

Seriez-vous intéressé par un tel système ?

Si oui, voyez-vous une fonction ou une idée en plus ?

Posté(e)

Ça serait très intéressant d'avoir de l'OCR sur un NAS Synology.

J'avais déjà creusé l'idée et on se rend vite compte de la complexité de l'automatisation.

Il faut déjà choisir un logiciel de reconnaissance de caractères pour traiter les documents numérisés (Tesseract ?) et le paramétrer correctement afin que les résultats de l'OCR soient suffisamment fiables (c'est la partie la plus complexe).

Pour la reconnaissance du document, il faudrait idéalement pouvoir définir une zone précise d'un document (encadré) contenant le texte permettant d'identifier le type de document (nom de l'opérateur mobile, du fournisseur d'électricité, ...). Ça permet de limiter l'OCR à une petite partie de l'image et de classer très rapidement un document. Certains éditeurs vont même jusqu'à reconnaître les logos.

Une fois le document classé, il est possible d'effectuer un OCR complet pour l'indexation.

Plus tard (beaucoup plus tard) on peut étendre la reconnaissance des zones en créant des modèles (un par type de document) afin d'extraire diverses informations du document (dates, montants, ...), et même reconnaître des zones répétées pour traiter des listes.

Sinon il existe aussi des applications sur smartphone qui font de l'OCR à partir d'un document photographié, reste à savoir lesquelles sont capables d'envoyer le document+OCR via FTP (ou autre).

C'est à proposer à Synology comme amélioration de DS File.

  • 3 semaines après...
  • 4 ans après...
Posté(e)

Bonjour,

je relance le sujet qui date de 2015, je suis effectivement à la recherche de cette solution discutée précédemment (tous mes docs scannés sont sauvés directement en pdf sur le Nas et je cherche a faire en auto dessus de l'ocr pour les recherches...).

Est-ce que depuis 4 ans, certains d'entre vous ont trouvé des solutions, ou créé des scripts ?

Merci d'avance !

Phil

Posté(e)

Bonjour,

Perso j’utilise la solution devonthink pro office (mac) qui permet de facilement gérer la base documentaire.
Maintenant, sans c’est possible, car mes scans sont automatiquement réalisés en pdf ocr et stockés sur le Nas.

Outre la solution logicielle citée, on tire avantage de Universal Search qui scrute le dossier où sont ces fameux pdf et c’est pratique et rapide pour récupérer une info.




Envoyé de mon iPad en utilisant Tapatalk

Posté(e)

Merci Daffy!

Effectivement le mieux serait que mes scans soient automatiquement fait en pdf ocr (c'est votre scanner qui gere ca ?)

j'etais plus parti pour trouver une solution qui tourne sur le NAS en arriere plan. En continuant mes recherches j'ai trouvé : tesseract-OCR . je vais voir plus loin ce que ca donne,

Je vais aussi regarder universal search de ce pas.

Merci !

Phil

 

 

 

 

Posté(e)

Bonjour,

(c'est votre scanner qui gere ca ?)


Oui mais sauf erreur la plupart permet ce genre de réglage. ( heu chez moi une simple imprimante multifonctions canon mg)




Envoyé de mon iPad en utilisant Tapatalk

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

Qui est en ligne (Afficher la liste complète)

  • Il n’y a aucun utilisateur enregistré actuellement en ligne

Information importante

Nous avons placé des cookies sur votre appareil pour aider à améliorer ce site. Vous pouvez choisir d’ajuster vos paramètres de cookie, sinon nous supposerons que vous êtes d’accord pour continuer.

Configure browser push notifications

Chrome (Android)
  1. Tap the lock icon next to the address bar.
  2. Tap Permissions → Notifications.
  3. Adjust your preference.
Chrome (Desktop)
  1. Click the padlock icon in the address bar.
  2. Select Site settings.
  3. Find Notifications and adjust your preference.