Dompter l’OCR de OneNote

√ OneNote Bureau

 

L’OCR de OneNote est redoutable d’efficacité :  c’est l’un de ses principaux atouts, quand il s’agit de faire des recherches dans des notes manuscrites.

En revanche, quand il s’agit de convertir des notes manuscrites en caractères d’imprimerie, OneNote est rapidement perturbé par des notes mixtes (texte-dessin), et même par les mises en page les plus simples :

OCR11.png
Page de test : un croquis à gauche, deux colonnes de texte (notez les différentes couleurs pour les identifier facilement).

 

Dans l’exemple ci-dessus, le diagramme comporte des « étiquettes » sur l’axe horizontal, et une légende en dessous de l’axe. Converti en texte, cela donne :

bOCR11.png
Le diagramme est illisible : de 3 barres, on passe à 2, et les étiquettes sont perdues !

 

Solution : déclarer le diagramme comme un dessin :

OCR12.png
Clic droit pour considérer l’entrée manuscrite sélectionnée (le diagramme) comme dessin

 

OCR12h.png
Le diagramme est maintenant conservé, mais les 2 colonnes de texte sont mélangées ! Notez également le « di-fférentes » qui n’est plus reconnu comme un seul mot !

Solution : séparer les 2 colonnes par un trait vertical :

bOCR13.png
Et voilà !

 

En revanche, délimiter les 2 colonnes de texte par une belle ligne verticale (dessiner\ligne) ne donne pas le même résultat :

OCR14.png
Curieusement, une belle ligne de séparation verticale ne donne absolument pas le même résultat…

 

Enfin, en dépit des conseils donnés ci-dessus, un document World généré par OneNote (Fichier\Envoyer\Envoyer vers Word) donne un résultat totalement illisible…

Bref, un OCR difficile à dompter : pour le moment j’ai abandonné l’idée de convertir en texte mes notes manuscrites. Mieux vaut écrire directement au clavier si on veux partager des notes propres, ou bien les ressaisir calmement après la réunion.

°°°

Un autre exemple de bug qui survient avec l’OCR :

OCR OneNote buggy
La conversion en texte (à moins que cela ne soit la selection au lasso) est capricieuse !

°°°

Enfin, contrairement à ce qui a pu se dire ça et là, l’OCR de OneNote reconnaît bien les notes manuscrites dans des documents scannés.

post it scanné
Recherche du mot « manuscrite » dans un Post It scanné par Office Lens.

 

En conclusion, un OCR vraiment performant :

  • pour la recherche : il retrouve n’importe quel mot en une seconde, parmi des milliers de pages ;
  • pour la conversion, il reste limité au texte au kilomètre.

 

Mise à jour Août 2016 : suite comparatif de l’OCR de OneNote avec celui de Nebo (voir ce billet).

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *