Connaissons-nous bien les « dangers » que portent en eux la foultitude, plus ou moins transparente, des formats de fichiers ?

Lors de la 2nde LinuxEdu du 27 mai 2004, Thierry Stoehr, président de l’AFUL nous a présenté un point sur les formats de fichiers et leurs dangers potentiels.

Les formats de fichiers dit « fermés »

Quid ?

Une définition

Quand un logiciel produit un fichier et que celui-ci ne peut être lu que par un logiciel identique ou bien ayant « appris » à lire ce fomat de fichier, on parle de format de fichier « fermé » (ou « propriétaire »). Cela signifie que les informations qui y figurent sont codées par et pour le logiciel en question. Mais surtout cela signifie que le concepteur/propriétaire du logiciel garde secret le codage des informations.

Des exemples

– les formats propriétaires des principaux outils de bureautiques comme la suite Office (doc ; xls …) ou les autres suite de bureautique
– quasiment tous les formats d’images, de sons, de vidéo, etc.

Les dangers

Les dangers de ce type de format relèvent :

– des problèmes de communication :

  1. il faut LE logiciel (ou alors un logiciel ayant « appris » à lire ce format)
  2. mais encore il faut, souvent, disposer de la bonne version dudit logiciel !

– des problèmes d’édition qui arrivent aux résultats suivants : ma banque de documents, créés sous tel format, devient illisible car :

  1. la nouvelle version dudit logiciel ne prend plus en compte les formats des versions antérieures
  2. l’éditeur cesse la commercialisation (ou la diffusion, ou le développement) dudit logiciel (Wordperfect !)
  3. last but not least, l’éditeur a disparu (faillite, fusion/acquisition, etc)

– des problèmes de sécurité car lors de l’écriture du fichier, le logiciel inscrit de nombreuses informations cachées, souvent utiles, mais non voulues par l’auteur

Les formats de fichiers dit « ouverts »

Quid ?

Il existe des formats de fichiers ouverts dont on sait comment les informations sont codées (ouverts) et qui peuvent être lus par quasiment toutes les plate-formes ou les logiciels (lisibles et échangeables). Citons les plus connus :
– le txt (ou ascii) ou le rtf (Rich Text Format) pour le traitement de texte ;
– le pdf (Portable Document Format) est une solution de la société Adobe : un format sûr, transposable et connu (on sait comment le codage s’effectue) ;
– le ps (PostScript) pour l’impression
– le html est connu et lisible par tous les navigateurs car la normalisation est assuré par le W3C… pour peu que les éditeurs respectent cette normalisation
– d’autres formats « universels » sont apparus pour les fichiers « multimedia » : 2 exemples, le png ou le svg (pour les images et animations)

Des limites

Ces formats présentent des limites dont la principale est l’impossibilité qu’ils ont à communiquer entre eux, c’est à dire l’impossibilité de générer un autre format que le leur. En effet ils codent les informations et leur mise en forme… mais ils restent tributaires d’un produit qui les lira.

Attention ! Un fichier « fermé » est toujours généré par un logiciel, lui aussi « fermé » ; par contre un logiciel dit « libre » ne générera pas forcément un format « ouvert » (ce type de logiciel génèrera le plus souvent, par défaut, un format « fermé »).

L’idée est donc de trouver un format à la fois ouvert, transposable, lisible ET qui structurera l’information de façon à le rendre quasiment indépendante des outils utilisés pour la lire ! Ce sera alors véritablement à ce moment que l’on pourra parler d’interopérabilité.

Ce format existe-t-il : le XML ?

Selon Thierry Strohel ce format pourrait être le XML (Extended MakeUp Language). Ce « métalanguage » fonctionne sur :

– la séparation entre l’information d’une part et sa mise en forme d’autre part (le fond et la forme)

– la structuration de l’information selon des métadescripteurs inclus dans le fichier ainsi généré (des descripteurs de l’information)

Poursuite quasi naturelle de l’évolution du html, le XML est lui aussi un langage fondé sur des balises ; il permet ainsi de créer de l’information sans se soucier de sa présentation (celle-ci relevant d’autres outils qui sauront interpréter, trier, sélectionner, etc) ou de l’usage final de cette information (écrit, écran, terminaux…).

Sachons qu’il existe d’autres formats que le XML fonctionnant sur ces principes…

En savoir un peu plus

Quelques URL pour aller un peu plus loin :

Formats et XML

– les formats de fichiers

– les formats de fichiers sur le site du CRI, la partie 1 et la partie 2

– le XML pour les débutants

idem

– ou encore chez Microsoft

Le monde du « libre »

– une liste de sites sur le CRI

– la suite openOffice