Aller au contenu

Structure de tableau recommandée pour une meilleure reconnaissance des tableaux

logo

Automatically translated

Lors de la reconnaissance des positions, nous faisons la distinction suivante :

Tables initialement reconnues :

Pour que les tableaux soient mieux reconnus initialement par le système, voici quelques recommandations :

Structure claire des tableaux

  • Pas de tableaux imbriqués : pas de combinaison de plusieurs tableaux dans un bloc
  • Pas de cellules regroupées
  • Pas d’éléments graphiques perturbateurs : tampons (d’imputation), logos et autres graphiques à l’intérieur du tableau

Colonnes

  • Les différentes colonnes du tableau doivent avoir un titre de colonne
  • Contenu homogène par colonne : Chaque colonne ne doit contenir qu’un seul type de données : par exemple, uniquement des chiffres, uniquement du texte, uniquement des dates.

Lignes

  • Si une position dans une colonne n’a pas de contenu, cela peut indiquer un « groupe de lignes ». Dans de tels cas, le système tente d’éditer les postes pertinents et d’emporter le « titre du groupe » dans le poste concerné :

Tableau selon facture :

Positions reconnues :

Tableaux inter-pages

  • Pour les tableaux inter-pages, il faut (en plus des exigences ci-dessus) un en-tête de colonne sur chaque page.
Tableaux entraînés manuellement :

Si un tableau d’un certain émetteur de factures n’est pas reconnu correctement, il est possible de le configurer manuellement. La configuration est enregistrée sur la définition de l’adresse et peut aider à mieux reconnaître à l’avenir les documents ayant la même présentation de cet expéditeur.

Important

Cette fonction ne prend en charge que les mises en page simples et cohérentes qui répondent aux exigences des tables initialement reconnues. Cet outil permet par exemple à l’utilisateur de mapper des colonnes reconnues sur des champs spécifiques – par exemple, définir une colonne reconnue comme « texte de position ».

Les mises en page de table complexes, très variables ou erronées ne peuvent pas être détectées de manière fiable par un entraînement manuel. Dans de tels cas, une formation centralisée peut aider à améliorer la détection, mais elle ne peut pas garantir la détection.

Tableaux à entraînement central :

Certains émetteurs de factures connus et répandus dans toute la Suisse utilisent des tableaux qui ne correspondent pas aux spécifications susmentionnées. Pour ces émetteurs de factures courants (p. ex. Swisscom, assurances sociales, etc.), nous entraînons les tableaux de manière ciblée. Il est ainsi possible d’entraîner les tableaux qui ne répondent pas aux exigences de l’analyse initiale.

Exemples :

Nous demandons aux clients de nous signaler de tels documents par le biais d’une « erreur de reconnaissance » afin qu’ils puissent être entraînés de manière centralisée.

Avons-nous répondu à votre question ?