ORC et OMR, reconnaissance de caractères musicaux, où en est-on ?
26 avril 2018
|
Lionel
|
|
Afin de mieux comprendre ce qu'est l'OMR, il est bon de faire un petit saut en arrière (1929) dans le temps pour en apprendre plus sur l'OCR. Optical Character Recognition: ou
Reconnaissance Optique des Caractères.
L'informatique rend fainéant et au lieu de recopier un très ancien article de journal, des programmeurs ont développé un logiciel qui reconnait les caractères d'imprimerie et
reconstitue les mots, les phrases et l'article en question dans un format électronique. Ce format la plupart du temps est celui compris par les traitements de texte. Voir
article de Wikipedia.
Une grille vient se positionner sur un caractère et en analysant les zones blanches ou noires, le calculateur détermine quelle lettre (chiffres, signes ou symboles) est présente.
D'années en années, le système s'est amélioré et les ordinateurs vont aussi plus vite dans les opérations de décryptage. Partant du principe qu'un texte est toujours aligné sur une
ligne horizontale imaginaire (ou visible) la grille vient s'aligner sur le bas du premier caractère à analyser et passe au suivant. Dans le temps chaque lettre était analysée, aujourd'hui
avec des dictionnaires dans toutes les langues, dès que quelques lettres sont trouvées, c'est un mot entier qui est proposé. Les polices de caractère sont également connues par les logiciels
qui vont donc beaucoup plus vite à analyser les signes.
Pour la musique, c'est donc un peu sur le même principe qu'est né l'OMR. Music OCR, à ne pas confondre avec la
reconnaissance optique des marques qui est un autre procédé.
Beaucoup plus jeunes (1960) les systèmes mis en place vont en premier chercher les lignes des portées. Puis analyser tous les symboles musicaux présents dans la première mesure. Certains
systèmes, vont ensuite sauter vers la mesure suivante, d'autres analyseront la mesure placée juste sous la première et ensuite la troisième mesure la plus basse, en colonne, avant de
passer à la colonne des mesures M+1. Les logiciels sont à tous les prix et l'explication est simple pour comprendre pourquoi souvent de tels écarts.
PHOTOSCORE de Neuratron, est à mon avis la Rolls des OMR. A 300 euros la bête ont en attend un sans faute dans le résultat de l'analyse des partitions.
Son fonctionnement se base sur le contenu en TEMPS de ce qui est trouvé dans une mesure. Si la partition à analyser est en 4/4, les systèmes déterminent
qu'il y a des erreurs si, dans une mesure il n'y a pas la présence des quatre temps. La mesure est encadrée en rouge. Il ne reste plus, avec les outils à compléter
ou corriger cette mesure pour qu'il y ait un sans faute au bout de l'analyse et de toutes les corrections.
Tout est pris en compte par ce logiciel, les nuances musicales et les voix multiples. D'autres produits existent et c'est bien d'avoir cette diversité, déjà par le prix. Mais il en
ressort que l'analyse peut s'avérer désastreuse et dévoreuse de temps.
Voici quelques noms de logiciels d'OCR :
- OMER de chez Myriad. Fait bien son Job, mais il ne faut pas lui en demander plus.
- SHARP EYE,
- SMART SCORE
- AUDIVERIS
- PDFTOMUSIC
Tous ces logiciels sont des dévoreurs de temps, car si après analyse et corrections vous obtenez un très beau fichier au format XML, c'est après que cela se gâte.
Dans ce temps, il faut déjà prendre en compte la numérisation du document. Avec un scanner et les nombreux allers retours du chariot et le positionnement des feuillets
bien droit sur la vitre. Ensuite en fonction de l'état du document, il y aura un taux élevé d'erreurs. Pour corriger toutes les erreurs présentes dans une partition passée par l'OMR
cela peut représenter des heures et des heures pour remettre tout d'aplomb. Le logiciel a lui aussi ses limites. Rien, pour l'heure, ne remplacera l'œil humain.
Donc, pourquoi cela ne fonctionne pas bien ? Tout simplement à cause des autres logiciels qui eux ne prennent en compte que le XML produit par l'analyse d'OMR. FINALE qui lui aussi n'est
pas donné, prend bien en charge le XML mais à l'exportation, il oublie de mettre dans le fichier Midi les paroles. Oubliées !!!
Bon, si le but de l'analyse est de pouvoir obtenir une plus belle partition à l'écran, c'est gagné, car si à l'affichage dans FINALE, il subsiste encore des erreurs, le temps passé là
encore à corriger est quand même moindre. Il ne faut toutefois pas compter trop ses heures, car on serait très vite dégoûter des logiciels d'OMR. Si vous n'avez pas FINALE et que vous
passez votre fichier XLM à la moulinette sur un site pour le transformer encore dans un autre format, c'est la catastrophe assurée.
Ce site
Niversoft convertit le fichier XML en fichier NWCtxt pour l'éditeur de partition Note Worthy Composer, mais visiblement dans l'opération
"moulinette" il y a des instructions XML qui sont soit oubliées, soit mal converties. J'ai pu en faire l'expérience et j'avoue aller beaucoup plus vite à encoder une partition directement
dans NWC que passer par le processus décrit ci-dessus.
PDFTOMUSIC n'est pas cher, mais le résultat obtenu est quand même très satisfaisant. Toutes les partitions récupérées sur la toile qui ont été créées avec MuseScore sont rapidement converties
dans le format Midi et le format propriétaire à la société Myriad pour ses autres logiciels.
SMARTSCORE est incorporé dans FINALE et franchement pour l'avoir testé avec des partitions ULTRA NEUVES de chez neuve et bien zéro. Trop dévoreur de temps pour les corrections.
Il y a aussi dans FORTE 9 PREMIUM un OMR. Et bien, là aussi, les résultats sont très moyens. Les créateurs doivent penser que, du fait qu'il y a derrière un très bon éditeur de partitions,
que toutes les corrections pourront se faire facilement. Oui, mais. Souvent c'est un peu château de cartes. Vous déplacez un élément et c'est d'autres qui se déplacent et donnent naissance
à d'autres erreurs. On n'en finit plus de corriger.
Certains logiciels d'OMR ne prennent en compte que le PDF ou le TIF. D'autres proposent de pouvoir scanner les partitions. Cela alourdi le logiciel, sans pour autant l'améliorer.
AUDIVERIS quant à lui prend en charge les partitions dans plusieurs formats et s'appuie sur le moteur JAVA pour fonctionner. Au départ, c'était un bon OMR, mais justement du fait de
s'appuyer sur JAVA qui change de versions tous les quatre matins et qui est rejeté en masse par CHROME cela pose un gros problème puisqu'il fonctionne en page WEB. Pour l'instant le
concepteur se penche depuis plusieurs mois sur ce problème pour sortir une nouvelle version via le site GITUB.
Avant de se lancer dans l'achat d'un logiciel d'OMR, il faut bien peser le pour et le contre. Quel est réellement votre besoin. Si votre TEMPS ou votre BUDGET sont comptés, oubliez. Par
contre, si vous avez du temps, de bons yeux, une très bonne connaissance de l'écriture musicale, pourquoi pas.