• chevron_right

      Arrêtons de (dé)tester nos applications web

      news.movim.eu / LinuxFRNews · 2 days ago - 08:44 · 4 minutes

    Dans ce billet, nous allons discuter d’un sujet crucial pour les développeurs et les testeurs : la pertinence des tests de bout en bout (ou end-to-end E2E) web .
    En effet, lorsqu’il s’agit de tester des applications web, les tests automatisés jouent un rôle vital, car ils peuvent être exécutés à plusieurs reprises sans effort et manuel supplémentaire. Parmi les tests automatisés, les tests bout en bout sont particulièrement importants, car ils simulent des cas d’utilisation réels. Cependant, il existe des pratiques courantes qui limitent la pertinence de ces tests.
    Nous allons ici examiner 3 mauvaises pratiques , ou erreurs courantes , qui limitent la pertinence de vos tests de bout en bout.

    1. Écrire des tests centrés développement

    La première erreur courante que l’on peut citer est de rédiger des tests E2E centrés sur la personne qui développe.
    Pour comprendre ce que nous entendons par test E2E centré sur le développement, prenons un exemple.
    Imaginons que je souhaite écrire un test pour vérifier que le titre « Welcome to weather App » et le bouton « Get Started » sont bien présents sur la page web suivante :

    Application Weather App

    Avec un outil populaire comme Cypress (sous MIT), je peux écrire le test suivant :

    Test Développer centric

    Et ça marche ! Mais ce test a, au moins, les 2 limitations suivantes :

    • Il est écrit en Typescript : Il n’est donc pas facile à comprendre pour les personnes qui ne développent pas (on entend ici toute personne qui ne comprend pas du code de programmation), et c’est un peu dommage, car il est censé représenter un cas d’utilisation réel.
    • Utilisation de testId : les testIds sont des attributs ajoutés par les développeurs pour faciliter la localisation des éléments de la page lors des tests.

    Mais lorsqu’on les utilise dans nos tests, nous n’interagissons pas avec notre application comme un utilisateur final. Nos utilisateurs finaux ne connaissent pas les ID de test, ils connaissent les boutons, les liens, les champs de formulaire, ils connaissent tout ce qu’ils peuvent voir et/ou entendre.

    Alors, comme bonne pratique, adoptons une approche centrée sur la personne utilisatrice ( user-centric ), qui consiste à utiliser des éléments connus de la personne utilisatrice finale pour interagir comme elle le ferait avec notre application.
    Cet exemple montre le même test écrit avec la solution UUV.

    Test User centric

    Le nom et le rôle accessibles sont utilisés pour exprimer le cas d’utilisation dans un langage anglais simple.

    2. Oublier l’utilisation du clavier

    La seconde erreur courante est de négliger l’usage du clavier lors des tests. Les directives WCAG stipulent que tous les éléments interactifs doivent être accessibles via une interface clavier. Cela profite non seulement aux personnes ayant des handicaps visuels ou moteurs, mais aussi à ceux qui préfèrent utiliser le clavier pour des raisons de productivité.
    Pour remplir un formulaire comme celui-ci :

    Formulaire à remplir

    Les utilisateurs déplacent naturellement une souris pour naviguer, car c’est l’usage par défaut qui est enseigné pour manipuler un ordinateur. Les développeurs ont donc l’habitude de reproduire ce genre de scénario lors de tests E2E, comme sur cet exemple :

    Remplissage du formulaire à la souris

    Pour les plus expérimentés d’entre nous, la navigation au clavier est un excellent moyen d’augmenter la productivité. Ainsi lorsque nous testons nos applications, une bonne pratique est de vérifier l’usage du clavier. Pour cet exemple, il convient donc de vérifier le remplissage du formulaire au clavier. Voici un scénario écrit avec l’outil UUV pour le faire :

    Remplissage du formulaire au clavier

    La première partie est identique à la navigation à la souris. Ensuite, nous plaçons le focus sur le coin gauche de l’application. Puis nous déplaçons le focus lorsque nous appuyons sur la touche tabulation et nous vérifions que le focus est sur le lien nommé Weather App's Logo . Nous reproduisons ce mécanisme avant de le soumettre.

    3. Ignorer l’accessibilité (#a11y)

    Contrairement à ce que l’on pourrait croire, les tests E2E sont un excellent contexte pour effectuer des vérifications d’accessibilité en utilisant des outils comme axe-core (sous MPL2) pour effectuer des contrôles de référence WCAG, ou en utilisant des bibliothèques comme uuv/a11y pour les vérifications RGAA. Il est important de garantir la non-régression de l’accessibilité lorsque l’on met à jour nos interfaces, surtout à une époque où l’intelligence artificielle prend de plus en plus de place.

    Voici un exemple de scénarios effectuant des vérifications d’accessibilité :

    Vérification d’accessibilité

    En résumé

    Commencer ou continuer à :

    • Écrire des tests centrés sur l’utilisation
    • Tester l’utilisation du clavier
    • Effectuer des vérifications d' accessibilité

    En adoptant ces pratiques, nous pouvons nous assurer que nos applications web sont robustes, accessibles et prêtes pour une utilisation réelle par tous nos utilisateurs.

    Mais au fait, qu’est-ce que UUV ?

    Logo UUV

    Pour faire simple, UUV est une solution opensource (MIT) qui facilite l’application des pratiques évoquées et de bien d’autres en matière de tests E2E.

    Disponible en tant que dépendance npm, UUV offre des phrases prêtes à l’emploi user-centric pour rédiger les tests E2E. Pour les développeurs, le plugin Jetbrains et l’extension VS Code facilite l’écriture des scénarios. De plus, l’assistant UUV , une application de bureau, permet de générer des scénarios de tests comme ceux pour vérifier la navigation au clavier, les interactions avec les boutons, et bien plus encore.

    Vous pouvez tester UUV directement sur vos projets ou à l'aide du Kata UUV E2E et contribuer à son développement sur GitHub .

    Merci pour votre lecture, n'hésitez pas à partager votre avis en commentaire !

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    • wifi_tethering open_in_new

      This post is public

      linuxfr.org /news/arretons-de-de-tester-nos-applications-web

    • chevron_right

      Revue de presse de l’April pour la semaine 29 de l’année 2024

      news.movim.eu / LinuxFRNews · 5 days ago - 17:34 · 3 minutes

    Cette revue de presse sur Internet fait partie du travail de veille mené par l’April dans le cadre de son action de défense et de promotion du logiciel libre. Les positions exposées dans les articles sont celles de leurs auteurs et ne rejoignent pas forcément celles de l’April.

    [clubic.com] Cette région française s'affranchit des GAFAM et opte pour des solutions maison

    ✍ Mélina Loupia, le vendredi 19 juillet 2024.

    Dans une démarche qui vise à regagner en autonomie et à réduire les coûts liés au fonctionnement de ses collectivités territoriales, une région française a décidé de remplacer les solutions des géants du numérique par des alternatives locales et open source.

    [L'OBS] Panne informatique mondiale de Microsoft: de nombreux aéroports touchés, Paris 2024 touché également, d'autres entreprises impactées

    ✍ Hendrik Schmidt, le vendredi 19 juillet 2024.

    Une panne informatique géante touche de nombreuses entreprises dans le monde, dont les aéroports. Le géant de la tech Microsoft a déclaré vendredi qu’il était en train de prendre des «mesures d’atténuation».

    [Next] La Dinum sous l'œil critique de la Cour des comptes

    ✍ Martin Clavey, le mercredi 17 juillet 2024.

    Cinq ans ou presque après sa création, la Cour des comptes se penche sur la Direction interministérielle du numérique. Elle demande la clarification de sa stratégie et de son budget pour évaluer ses dépenses convenablement. Elle pointe aussi le besoin d’une vigilance dans l’exercice de ses missions historiques que sont la promotion de la donnée publique, assurée par Etalab, et le réseau interministériel de l’État.

    Et aussi:

    [Developpez.com] La Suisse exige que tous les logiciels développés pour le gouvernement soient open source, avec divulgation du code source du logiciel

    ✍ Jade Emy, le mardi 16 juillet 2024.

    La Suisse impose la divulgation du code source des logiciels pour le secteur public, ce qui est une étape importante sur le plan juridique

    [Next] Neutralité du Net: aux États-Unis, une cour d'appel met en pause son retour

    ✍ Sébastien Gavois, le mardi 16 juillet 2024.

    La neutralité du Net aux États-Unis ressemble un peu au jeu du chat et de la souris avec la FCC. Elle a tout d’abord été instaurée sous la présidence de Barack Obama en 2015. Elle a ensuite été supprimée en 2018 lorsque Donald Trump était président et qu’il avait positionné Ajit Pai à la tête de la FCC.

    [ITRmanager.com] Logiciels libres dans l’enseignement scolaire: le CNLL salue une avancée du guide d’accompagnement du programme de technologie

    Le lundi 15 juillet 2024.

    Le Guide d’accompagnement du programme de technologie au cycle 4, daté de février 2024, recommande de “privilégier” les logiciels libres dans de nombreuses activités pédagogiques et technologiques. Stefane Fermigier, du CNLL, Conseil National du Logiciel Libre, se réjouit de cette avancée significative dans l’intégration des logiciels libres au sein des programmes éducatifs français. Toutefois, le CNLL regrette que cette évolution ait nécessité 12 ans et que les recommandations concernant les logiciels libres demeurent principalement confinées à l’enseignement technologique.

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    • wifi_tethering open_in_new

      This post is public

      linuxfr.org /news/revue-de-presse-de-l-april-pour-la-semaine-29-de-l-annee-2024

    • chevron_right

      Projets Libres! Episode 30 : designers UX/UI et logiciel libre

      news.movim.eu / LinuxFRNews · 5 days ago - 09:00

    Pour ce trentième épisode, nous parlons d'interface centrée utilisateur.

    Avec Maiwann, UX/UI Designer freelance et contributrice à différents projets, nous abordons les thèmes suivants :

    • son parcours
    • ses contributions dans le logiciel libre, en particulier Exodus Privacy, Contribulle et Framasoft
    • son arrivée dans le logiciel libre
    • les barrières rencontrés par les UX Designers dans le libre
    • ce qu'est la conception centrée utilisateur
    • le manque de connaissance des développeurs de la conception centrée utilisateur
    • sa manière de travailler
    • ses conseils pour les designers qui souhaitent intégrer le monde du libre

    Bonne écoute !

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    • wifi_tethering open_in_new

      This post is public

      linuxfr.org /news/projets-libres-episode-30-designers-ux-ui-et-logiciel-libre

    • chevron_right

      Agenda du Libre pour la semaine 30 de l'année 2024

      news.movim.eu / LinuxFRNews · 6 days ago - 05:03 · 7 minutes

    Calendrier Web, regroupant des événements liés au Libre (logiciel, salon, atelier, install party , conférence), annoncés par leurs organisateurs. Voici un récapitulatif de la semaine à venir. Le détail de chacun de ces 7 événements (France: 7) est en seconde partie de dépêche.

    Sommaire

    [FR Le Mans] Permanence du mercredi - Le mercredi 24 juillet 2024 de 12h30 à 17h00.

    Assistance technique et démonstration concernant les logiciels libres.

    Il est préférable de réserver votre place à contact (at) linuxmaine (point) org

    Planning des réservations consultable ici.

    [FR Paris] Votre nouvelle suite bureautique en ligne ? - Le mercredi 24 juillet 2024 de 19h00 à 21h00.

    Rejoignez-nous pour notre prochain meetup dédié aux suites bureautiques intégrables à Nextcloud. Cette session sera l'occasion idéale pour découvrir et discuter des diverses solutions de bureautique offertes par Nextcloud. C'est une excellente opportunité pour échanger des retours d'expérience et approfondir vos connaissances.

    • Les différentes propositions de Nextcloud: Notes, Tableau,…
    • Intégration avec les suites bureautiques complètes: nos retours d'expérience: Microsoft Office, Collabora Online, OnlyOffice, Nextcloud Office
    • Quels appareils compatibles: Nextcloud Desktop, sur ordiphone,…

    Une consommation est à prévoir pour agrémenter notre rencontre ; à régler sur place.

    Profitez de cette opportunité d'approfondir vos connaissances sur les suites bureautiques intégrées à Nextcloud et d'échanger avec d'autres utilisateurs passionnés. Inscrivez-vous dès maintenant et préparez-vous à une soirée riche en discussions et en découvertes !

    Nous avons hâte de vous y retrouver !

    [FR Toulouse] Atelier-formation soudure électronique - Le jeudi 25 juillet 2024 de 18h00 à 20h00.

    Par "soudure électronique", on entend soudure à l'étain/plomb (brasure pour les puristes) sur connecteurs, circuits imprimés à composants traversants, dans le but de réaliser une connexion électrique.

    Réparer, ça implique parfois de manier le fer à souder! Encadré-e-s par un bénévole des Repair Cafés ou des Café Bricol', venez apprendre à effectuer des soudures électroniques simples, c'est-à-dire des soudures sur connecteurs et circuits imprimés à composants traversants d'au moins 5mm.

    Inscription obligatoire sur https://framaforms.org/formation-soudure-2501-inscription-1704442730
    Gratuit

    [FR Annecy] Réunion hebdomadaire AGU3L - été 2024 - Le vendredi 26 juillet 2024 de 20h00 à 23h59.

    L'AGU3L Logiciels Libres à Annecy, votre association, se réunit tous les vendredis à partir 20h00 et jusque vers 1h00 du matin.

    Entrée par le côté, entre les deux bâtiments. Au fond du couloir à droite, là où il y a de la lumière.

    ⚠️ Vérifiez sur le site avant de vous déplacer, y a un bandeau en haut qui confirme la tenue de la réunion.

    Le programme de la réunion, s'il y en a un, est sur notre site. 😉 ⬇️

    Digression possible, voire probable.

    Vous pouvez aussi nous soumettre un programme sur un thème particulier: Exemples: Libre Office les listes à puces, recompiler un noyau Linux avec les options spécifiques, démo sur un logiciel libre que vous venez de pratiquer et souhaitez partager, etc.

    Apportez à boire, à manger. Un ordi ça peut aider.
    De la bonne humeur et un brin de Liberté.

    Et tout ce que vous trouvez sympa: des amis, des projets, des trouvailles, etc.

    Besoin d'une installation Linux?

    Pas de problème! Laissez nous un petit message avant au cas où l'on soit pas dispo ce soir là.

    C'est install party à la demande!

    [FR Onnion] Initiation à Python et Bash - Du samedi 27 juillet 2024 à 09h30 au dimanche 28 juillet 2024 à 16h00.

    LesFousDuCode

    Pour continuer à casser la fracture numérique, nous continuons à initier tous ceux qui le veulent à s'initier aux codes en manière générale.

    Profiter des vacances pour toucher à des langages techniques pouvant être utile dans la vie de tous les jours ! S'initier à l'algorithme et faire des interfaces graphiques pour des applications de tous les jours.

    Samedi 27 - initiation au python (faire un petit programme, gérer ses mails, gérer ses documents, gérer l'humidité de ses plantes,…).

    Dimanche 28 - initiation au bash (faire un petit programme, lancer des programmes automatiquement, créer des jeux, télécharger des vidéos,…).

    Newbee, débutant, curieux ayant déjà pratiqué,… à partir de 14 ans.

    Fin septembre, nous organisons deux jours d'initiation à l'utilisation d'internet sans flicage ni gogole ni fa se bouk, il faudrait être tik tok pour faire autrement.

    Date à venir, mais préinscription possible en s'abonnant à notre profil framapiaf:

    https://framapiaf.org/@chiantsducode

    Tous nos codes à partager pour apprendre qui seront utilisés en partie les 27 et 28 juillet:

    https://www.gitlab.com/gaiac

    [FR Vandœuvre-lès-Nancy] Atelier libre - Monnaie locale sur OsmAnd - Le samedi 27 juillet 2024 de 10h00 à 10h00.

    Concept de l'Atelier libre

    Les usagers de la FCCL sont invités à partager leurs savoirs pour trouver ensemble, une solution à une problématique posée. Toute idée peut être proposée à l'occasion d'un atelier à condition bien sûr qu’elle soit cohérente avec la philosophie de la culture du libre.

    Thème du jour

    OsmAnd est une application de cartographie et de navigation sur ordiphones. Les cartes utilisées sont celles d'OpenStreetMap.

    L'atelier porte sur un projet consistant à implémenter sur OsmAnd l'information relative à la prise en charge des monnaies locales dans les commerces.

    Horaires

    Cette animation se déroule le matin, de 10 h à 12 h.

    Inscription aux ateliers

    Inscription possible depuis le site web .

    [FR Wintzenheim] Réunion du Club Linux - Le samedi 27 juillet 2024 de 13h00 à 13h00.

    Réunion du Club Linux

    Le samedi 27 juillet 2024 de 13h00 à 19h00.

    MJC du Cheval Blanc, 1 faubourg des Vosges, Wintzenheim, Grand Est

    + Leaflet | © OpenStreetMap Rencontre du Club Linux de la MJC du Cheval Blanc qui se réunit toutes les 3 semaines et accueille toutes les personnes qui souhaitent découvrir ou approfondir Linux et les Logiciels Libres . Aucune compétence n'est demandée.

    Pendant ces rencontres, informelles,

    • nous accueillons celles et ceux qui cherchent une réponse ou souhaitent découvrir Linux et les Logiciels Libres ,
    • nous installons Linux sur des ordinateurs, la plupart des fois en " dual boot "(*), ce qui permet de conserver l’ancien système (par exemple Windows) et d’utiliser quand même Linux , en choisissant au démarrage,
    • nous partageons nos recherches (nos difficultés aussi) et nos découvertes, les nouveautés.

    Le Club Linux est également impliqué dans une démarche de libération des GAFAM (Google Apple Facebook Amazon Microsoft) et de promotion de solutions libres comme, entre autres, Wikipedia , OpenStreetMap , les Framatrucs (*), les C.H.A.T.O.N.S (*) et beaucoup d’autres.

    (*): mais on vous expliquera

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    • wifi_tethering open_in_new

      This post is public

      linuxfr.org /news/agenda-du-libre-pour-la-semaine-30-de-l-annee-2024

    • chevron_right

      Le deuxième texte - Médias hostiles - « Libre à vous ! » du 9 juillet 2024 - Podcasts et références

      news.movim.eu / LinuxFRNews · Friday, 19 July - 13:58 · 1 minute

    215ème « Libre à vous ! » de l’April. Podcast et programme :

    • sujet principal : Le deuxième texte : retranscrire, mettre en valeur et partager des textes de femmes via les communs numériques, avec Clara et Fil de l’association Le deuxième texte
    • la chronique « la pituite de Luk » sur le thème « Médias hostiles »
    • la chronique « Le libre et la sobriété énergétique » de Vincent Calame sur le thème « éloge de la lenteur ». Rediffusion de la chronique diffusée dans l’émission Libre à vous ! du 21 février 2023

    Rendez‑vous en direct chaque mardi de 15 h 30 à 17 h sur 93,1 FM en Île‑de‑France. L’émission est diffusée simultanément sur le site Web de la radio Cause Commune .

    Vous pouvez laisser un message sur le répondeur de la radio, pour réagir à l’un des sujets de l’émission ou poser une question. Le numéro du répondeur : +33 9 72 51 55 46.

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    • wifi_tethering open_in_new

      This post is public

      linuxfr.org /news/le-deuxieme-texte-medias-hostiles-libre-a-vous-du-9-juillet-2024-podcasts-et-references

    • chevron_right

      Une histoire de formats : il n’y a pas que la taille qui compte

      news.movim.eu / LinuxFRNews · Friday, 19 July - 10:46 · 34 minutes

    Dans cette nouvelle excursion dans le temps et dans l’espace du Transimpressux, nous allons rendre une rapide visite à Théotiste Lefevbvre (1798 - 1887) prote d’imprimerie et à quelques-uns de ses confrères ainsi que dans les magasins de quelques bibliothèques. Nous passerons aussi, un grand moment du côté de la Silicon Valley et de Redmond dans l’État de Washington, bien obligé puisqu’on parlera beaucoup de formats numériques, sans oublier d’aller dire bonjour à Donald Knuth, Tim Berners-Lee et John Gruber. On terminera notre exploration quelque part dans les archives numériques de la Bibliothèque nationale de France (BnF).

    La climatisation du Transimpressux a été entièrement révisée et le bar rechargé en boissons fraîches et glaces en tous genres. On vous souhaite un bon voyage.

    Le transimpressux

    Sommaire

    Préambule

    Cette dépêche ne se veut pas exhaustive sur les formats en tous genres ni très technique sur les formats informatiques. Pour les formats d’image, qui ne sont pas traités ici, je vous renvoie à l’excellente dépêche de Tanguy Ortolo qui a fait le tour de la question et au journal de Glandos sur l’intégration du JPEG XL dans les navigateurs.

    Les formats matériels, entre coût et rangement

    Encore aujourd’hui, le format matériel d’un document, spécialement, s’il s’agit d’un livre, est important pas uniquement pour des questions de coût. Mais aussi à cause d’eux. C’est parce que le papier coûtait cher qu’ Alde Manuce a créé l’italique au début du 16 e siècle. L’italique prenant moins de place que les autres styles de caractères, il devenait possible d’imprimer des livres en petit format qui pouvaient ainsi être achetés par une clientèle impécunieuse.

    Une pile de livres
    Des différences de taille et de tailles. Image retravaillée avec le filtre « Pencil Portrait » de Q’mic-Qt (et un peu Inkscape).

    Les rouleaux, volumen ou rotulus

    La taille de ces rouleaux varie beaucoup. Ils peuvent atteindre plusieurs mètres de long (ou de large, selon le sens de lecture). Témoin cette remarque d’ Auguste Molinier , chartiste et bibliothécaire, en 1892 :

    On a étudié récemment la longueur des volumina antiques. En Égypte, elle paraît avoir été illimitée ; un rouleau trouvé à Thèbes a 43 m. 50, ce qui est excessif ; il est vrai que le moyen âge a eu des rouleaux de parchemin, plus solides, mais encore plus lourds et infiniment plus longs. Pour les œuvres littéraires grecques et latines, un érudit moderne, M. Birt, a évalué à 12 mètres la longueur extrême des volumina. 1

    Ces longueurs démesurées ne sont pas propres aux Égyptiens. Les Archives nationales de Paris possèdent un parchemin d’une longueur d’une vingtaine de mètres . Daté de 1307, ce rouleau consigne les aveux, obtenus sous la torture, de cent-trente-huit Templiers. Il va sans dire que leur longueur et leur ancienneté rend les rouleaux très difficiles à manipuler, une difficulté que la numérisation élimine.

    Des formats des livres

    Les noms des formats des livres en imprimerie traditionnelle sont liés au nombre de pages que l’on imprimait sur une feuille. Le mot « format » lui-même pourrait venir des châssis, ou « formes » dans lesquels on plaçait les pages à imprimer. Ce procédé s’appelait l’imposition.

    Les formats les plus usuels, du plus grand au plus petit :

    • in-folio : soit quatre pages par feuille, la taille la plus grande de livre,
    • in-quarto, huit pages,
    • in-octavo, seize pages,
    • in-douze, vingt-quatre pages,
    • in-dix-huit, trente-six pages.

    La répartition des pages sur la feuille était à la fois importante et délicate puisqu’une fois imprimée, la feuille était pliée. Il fallait donc veiller non seulement à la bonne répartition des pages sur la feuille, mais aussi à leur sens. Dans son Guide pratique du compositeur d’imprimerie , Théotiste Lefebvre consacre plus d’un quart de son livre (119 pages sur 440) à cette délicate question. Dans son petit guide sur la Typographie , Charles-Félicien Huart y consacre aussi plusieurs pages.

    Un exemple de répartition des pages 2 pour un volume in-douze, « côté de première » indique le recto, « côté de seconde », le verso. La feuille est pliée en trois dans le sens de la hauteur et deux dans la largeur.

    répartition
    Recto : deux séries de pages tête en bas, pages 12, 13, 16 et 9 (1 re série) et 8, 17, 20 et 5 (2 e série) et, en dessous pages 1, 24, 21 et 4. Verso : deux séries de pages tête en bas, pages 10, 15, 14 et 11 (1 re série) et 6, 19,18 et 7 (2 e série) et 3, 22, 23 et 2 en dessous.

    Cette différence de tailles peut amener les bibliothèques dont le fond n’est pas directement accessible au public à opter pour un classement matériel des livres basés sur le format. On aura ainsi des côtes du genre « in12-numéro d’inventaire ». C’est un système très efficace et qui évite d’avoir un petit livre (littéralement) perdu au milieu de livres nettement plus grands.

    Les formats actuels, livre et papier

    L’indication de format à partir du nombre de pages imprimées sur une feuille ne donne pas d’information précise sur la taille effective des livres. Il faut signaler que les dimensions changent en fonction de celles de la feuille d’origine. Les appellations actuelles, côté édition, du style Livre de poche (environ 10,5 cm x 17,5 cm), livre broché ou encore grand format , utilisées en lieu et place d’in-folio, in-octavo, etc. réservés plutôt au livre ancien ne sont pas plus précises.

    En, revanche, la taille des feuilles de papier les plus utilisées a fait l’objet d’une norme, la norme ISO 216. Elle concerne les formats A, dont le fameux A4 qui est celui des feuilles standard des imprimantes de bureau et le format B. Le principe : plus le numéro est élevé, plus la feuille est petite. La numérotation commence à 0 qui fait un mètre carré (84,1 cm x 118,9 cm) pour le format A. La taille de la feuille du numéro supérieur devant être égale à la moitié de celle du numéro inférieur qui la précède. En d’autres termes : le format A3 égal deux fois le format A4 qui, lui-même, est deux fois plus grand que le format A5. Il en va de même avec le format B. Cela explique au passage pourquoi le format A4 mesure 21 x 29,7 cm et pas 21 x 30 cm.

    Les formats de texte

    Jusque dans les années 1990, il y avait un nombre très important d’outils et de formats de textes. Writer de LibreOffice, d’après mes comptes, peut ouvrir jusqu’à quarante-quatre formats de fichier différents, hors modèles et hors web, mais n’enregistre que dans des formats qui sont ceux encore utilisés à l’heure actuelle. Ce qui réduit la liste à treize formats incluant les modèles et l’HTML.

    Sur cette frise chronologique, on a, en haut, des formats de texte avec leur date de naissance plus ou moins approximative et, en dessous, des langages de balisage avec leur date de naissance également.

    Formats de texte et langages de balisage
    Les formats de texte : 1977 Texte brut, 1987-2007 RTF, 1990-2007 DOC, 2005 ODT, 2007 DOCX. Ils ont été choisis parce qu’ils sont les plus connus, voire, les plus utilisés. Dans cette liste deux formats ne sont plus maintenus, les formats RTF et DOC. Mais il existe encore des amas de fichiers dans ces deux formats.

    Le texte brut, .txt

    Le texte brut, nait à une date imprécise. Probablement vers la fin des années 1950 ou au début des années 1960. Le premier RFC 3 qui définit un standard de protocole pour des messages en texte brut ( Standard for the Format of Arpa Network Text Messages ) date de 1977, il porte le numéro 733 et a été rédigé par l’agence américaine pour les projets de recherche avancée de défense (DARPA pour Defense Advanced Research Projects Agency ).

    Au début, le format n’acceptait que l’Ascii, à savoir les vingt-six lettres de l’alphabet, les chiffres, les ponctuations de base et les caractères de commande Ascii. Ce qui en fait un format simple, mais très pauvre. L’Ascii est codé sur 7 bits, ce qui ne permet d’avoir que cent-vingt-huit caractères, en fait quatre-vingt-dix imprimables et trente-huit pour les codes de commande 4 . Il accepte, depuis, l’Unicode. Depuis quand ? Difficile à préciser, mais la première mention d’Unicode qui figure sur le site rfc-editor remonte à juillet 1994 (en) , RFC 1641, à titre expérimental. On peut supposer, en tout cas, que le consortium Unicode qui réunit la fine fleur de l’informatique a dû très tôt faire en sorte que son standard puisse être accepté dans le format texte brut.

    Ce format se révèle assez vite insuffisant de part sa simplicité même, confinant à la pauvreté : pas d’enrichissement typographique, pas de notion de style ni de hiérarchie des paragraphes, pas de possibilité d’avoir des images. Il est, de fait, plutôt inférieur à ce que l’on peut avoir sur du papier. Il reste néanmoins très utilisé et par toutes les applications qui traitent du texte : éditeurs de texte, bureautique, etc. Il a pour lui l’avantage d’être simple, léger et interopérable. C’est le format, par exemple, avec lequel la BnF Gallica délivre les documents « bruts de numérisation » (il faut copier-coller le texte ailleurs pour le garder et le retravailler), et c’est, bien évidemment, celui des RFC .

    Il y a des personnes qui recommandent de conserver le texte en texte brut, compte tenu des limitations du format, ce n’est pas franchement conseillé pour des documents un peu complexes étant donné qu’il y aura énormément de pertes d’information.

    Le RTF

    En 1987, Microsoft lance le Rich Text Format (RTF) qui permettait d’avoir du texte « enrichi » avec des attributs : gras, italique, souligné et de dépasser le cadre du texte brut. C’est un format qui a été pendant un certain temps, un standard d’échange de fait pour ce type de fichiers. Il était au moins lu par beaucoup de logiciels sur nombre de systèmes d’exploitation. C’était un format pratique d’échange, notamment à une époque où le PDF n’était pas encore un format ouvert et ne pouvait être généré que via le (cher) logiciel d’Adobe. Et aussi parce que c’était l’époque de la « grande démocratisation » de l’informatique, et, qu’à vrai dire, les utilisateurices finaux ne savaient pas trop comment, surtout sous quelle forme et ce qui se passait quand on échangeait des fichiers.

    Aussi pratique que soit le format RTF, outre son absence de légèreté, il était néanmoins très limité : pas de texte structuré autrement que sur un plan purement visuel, par exemple. Microsoft arrêtera de le maintenir en 2008 (il aura tenu vingt ans tout de même !). C’est donc un format mort.

    Le .doc, un format propriétaire incontournable

    Quand Microsoft lance sa suite bureautique dans les années 1990 (la date sur la chronologie n’est pas tout à fait exacte), il adopte pour le traitement de texte, Word, l’extension .doc qui avait été aussi celle de WordPerfect. Word avait pour lui de montrer le rendu du texte immédiatement : le fameux WYSIWYG pour « What you see is what you get » (ce que vous voyez est ce que vous obtenez).

    La suite finit par devenir quasiment incontournable et le format DOC de Word devenir un « standard de fait ». Microsoft abandonnera le DOC en 2007 pour le DOCX basé sur l’Office Open XML. On produira encore longtemps après des fichiers en .doc en vertu du « tout le monde n’a pas la version de MsOffice 2007 ». On trouve encore sur internet des modèles de fichiers à ce format à télécharger.

    Il était reproché au format son poids, lourd, des problèmes de confidentialité (on pouvait, par exemple, retrouver du texte effacé avant l’enregistrement ou le modèle de l’imprimante 5 ) et sa faiblesse devant les virus. Et, bien entendu, c’était un format propriétaire et pas interopérable. Un autre défaut majeur du format était qu’il était modifié à chaque nouvelle version de Word ce qui impliquait de devoir acheter la nouvelle version du logiciel pour pouvoir travailler sur les nouveaux fichiers en .doc.

    Microsoft délivrera les sources du format en 2006, mais les spécifications semblent ne plus figurer sur le site de la firme. Le code source de la version d’origine de Word, quant à lui, a été rendu public et versé au musée américain de l’histoire de l’ordinateur (en) .

    Le .doc peut encore être ouvert et travaillé d’un grand nombre de logiciels. Abiword par exemple ouvre les .doc mais pas les .docx. En revanche, il est de moins en moins possible de générer des fichiers à ce format, et c’est une bonne chose. On ne saurait que trop vous suggérer de transformer tous les fichiers en .doc qui traîneraient encore dans vos ordinateurs en ODT (ou de faire le ménage). Il en va de même pour le format de modèle .dot.

    L’ODT : un format ouvert

    En 2005 apparaît un format bien intéressant : le format ODT, qui est une des composantes du plus général OpenDocument Format (ODF) avec le O d’Open, le D de Document et le T de Texte, l’extension OTT étant pour les modèles avec le premier T pour Template (modèle en anglais). L’ODF est géré par le consortium OASIS, pour Organization for the Advancement of Structured Information Standards (Organisation pour l’avancement des normes d’informations structurées).

    OASIS est une structure à but non-lucratif autorisée par l’ISO (International Standard Organization, l’organisation dont l’objectif social est l’élaboration et la publication de normes mondiales de produits et services), à publier des standards dont les spécifications sont publiquement disponibles sans passer par les fourches caudines de l’ISO. Le consortium a été créé en 1993, il s’appelait à l’époque SGML Open . Il était constitué de fournisseurs et d’utilisateurs d’outils informatique, son but était le développement de lignes directrices pour l’interopérabilité de logiciels utilisant le langage de balisage SGML. Il change de nom en 1998 pour devenir OASIS qui reflète mieux les travaux du consortium. Parmi les cent-seize membres (l’adhésion est payante) : à peu près toutes les grandes entreprises de l’informatique américaine et quelques chinoises ou japonaises (Alibaba, Hitachi, Huawei, Fujitsu…) mais aussi des organismes tels que le Parlement européen, l’Office des publications européennes, le Ministère français de l’Intérieur, le FBI, des universités (Brno, Milan, Luxembourg, Oslo, Westminster, MIT, etc.), la Biblioteca del Congreso Nacional du Chili, TheDocumentFoundation, etc. Il existe en outre une fondation européenne à but non lucratif OASIS Open Europe (en) affiliée au consortium et dont l’objectif est de soutenir le rôle de l’Europe dans le développement de l’open source et des normes ouvertes.

    La version 1.0 du format OpenDocument (ODF) pour les applications bureautiques a été approuvée le 1 er mai 2005 à l’unanimité des soixante-dix-huit membres ayant voté. La version 1.0 des directives pour l’accessibilité du format ODF, quant à elle a été approuvée à l’unanimité des onze membres ayant voté le 1ᵉʳ mai 2008. La dernière version du format ODF est la 1.3 (en) , approuvée le 27 avril 2021. LibreOffice l’a intégré à partir des versions 7, pratiquement à la sortie de la norme, c’est le format d’enregistrement par défaut. La norme ODF 1.3 a mis notamment l’accent sur la signature et le chiffrage des documents.

    Le format ODF est basé sur le XML. C’est un fichier « compressé » qui en contient plusieurs 6 :

    • le fichier meta.xml contient des informations au sujet du document (l’auteur, la date de la dernière sauvegarde),
    • le fichier styles.xml contient les styles utilisés dans le document,
    • le fichier content.xml contient le contenu principal du document (texte, tableaux, éléments graphiques…),
    • le fichier settings.xml , en général spécifique à une application, contient certains paramètres tels que l’imprimante sélectionnée…,
    • les fichiers META-INF/manifest.xml contiennent des informations supplémentaires sur les autres fichiers (comme le type MIME ou le chiffrement).

    Plus des dossiers : Pictures , Thumbnails , etc.

    Ce format est le format natif notamment de LibreOffice, OpenOffice 7 , Calligra, Collabora Online, GoogleDocs, Zoho , il est aussi ouvert, travaillé et enregistré par des logiciels tels que MsOffice depuis 2007 (2016 pour la version pour MacOS), Office365, OnlyOffice ou AbiWord (listes non limitatives).

    L’une de ses très grandes forces est, qu’à l’instar du format HTML, toute la mise en forme repose sur des styles. Ce qui rend très évolutifs et adaptables les documents au format ODT (pour peu qu’ils le soient avec un logiciel qui le gère bien).

    En France, le format ODF est le seul format bureautique recommandé par le référentiel général d’interopérabilité . Le format ODT étant mentionné comme format à privilégier par nombre d’administrations de par le monde .

    Le format DOCX et son OOXML

    L’année 2007 est celle qui « révolutionne » la suite bureautique de Microsoft. En effet, la firme abandonne les vieux formats pour en adopter des nouveaux basés sur le XML d’où le X de l’extension. Mais pas n’importe quel XML, le XML maison appelé Office Open XML (OOXML pour faire court). Il est fort probable que, ce faisant, l’idée était de court-circuiter le standard ODF. Microsoft a d’ailleurs livré une guerre féroce pour que son OOXML soit accepté par l’ISO en s’y reprenant à deux fois. La norme, adoptée le 17 aout 2008, porte le numéro ISO/IEC DIS 29500. Il est possible (probable ?) également que, Word étant ce qu’il est, se baser sur le XML de l’ODT aurait vraisemblablement nécessité un grand travail de refonte du logiciel. Il existe deux « variantes » de DOCX, le premier, celui de la version 2007 et celui de 2010. En effet, la norme ISO/IEC DIS 29500 n’est pas compatible avec Office 2007.

    Sur le plan technique, il est reproché à l’OOXML sa complexité qui en rend difficile la mise en œuvre. À tel point qu’il se dit que Microsoft lui-même ne l’implémente pas correctement. La dernière version d’OOXML est actuellement la référence ISO/IEC 29500-1:2016 (en) de novembre 2016 (elle fait 5024 pages).

    Sur le plan juridique, le caractère libre de la norme est flou, il en ressort une certaine instabilité sur ce plan. Avec les spécifications, Microsoft a distribué :

    un document promettant de ne pas poursuivre les auteurs de l’utilisation d’Office Open XML dans un autre logiciel que ceux de Microsoft. Cette promesse de non-poursuite elle-même laisse certains flous, notamment :
    • s’appliquant à la norme ECMA en l’état, s’applique-t-elle à une éventuelle version finale de l’ISO ?
    • s’applique-t-elle à tous les brevets logiciels nécessaires à la mise en œuvre de la norme ?
    • s’applique-t-elle également aux extensions du format OOXML ?
    La licence d’utilisation de OpenXML est incompatible avec les programmes sous la licence GPL. 8

    À l’instar des fichiers ODF, le DOCX est un fichier compressé qui en contient plusieurs. On en trouvera l’anatomie (en) par exemple sur le site Office Open XML (en) . 9

    Il est actuellement ouvert, voire travaillé et enregistré, de la plupart des suites bureautiques.

    Des langages de balisages

    Parler des formats de texte sans évoquer les langages de balisage serait assez inepte puisque les formats modernes sont basés dessus. Pour rappel, un langage de balisage est un langage servant à définir et à structurer les informations dans un document.

    Il en existe de nombreux, mais on n’évoquera que ceux qui semblent les plus connus ou les plus utilisés.

    TeX le grand ancien

    TeX fait figure de grand ancien, puisque la première version du langage de balisage date de 1978. Cela dit, on devrait peut-être plutôt parler « d’écosystème » car c’est à la fois un format, le langage de balisage utilisé par LaTeX et un logiciel libre de composition. TeX a été créé par Donald E. Knuth, professeur émérite à l’Université de Stanford et considéré comme l’un des pionniers de l’algorithmique. L’objectif de Donald E. Knuth en créant TeX était d’avoir des documents scientifiques et techniques de bonne qualité typographique, ce qu’il n’était pas possible d’obtenir avec les logiciels d’édition de l’époque. Le principe du langage TeX est la séparation du contenu de et la forme, ce qui était innovant.

    TeX est complété par LaTeX qui est « un ensemble de macros permettant de faire beaucoup de choses » 10 , et, bien sûr, par le langage de composition de polices vectorielles Metafont. LaTeX a été développé par Leslie Lamport. La première version est sortie en 1983.

    Ce n’est pas un traitement de texte, l’idée étant que l’auteur ou l’autrice :

    puisse mettre son énergie à rédiger le contenu sans être distrait par l’apparence de son document. En écrivant en langage LaTeX, l’utilisateur doit donc définir sémantiquement le contenu de son document plutôt que visuellement. DMS, Université de Montréal .

    On peut générer des fichiers TeX soit directement avec un éditeur de texte, soit avec des logiciels comme Lyx ou encore Overleaf qui est un éditeur LaTeX en ligne et collaboratif. Mais, pour en voir le rendu, il faudra soit faire un PDF, si on utilise un éditeur de texte, soit passer par le visualiseur, quand il existe, dans un logiciel tel que Lyx.

    À ma connaissance la plupart des suites bureautiques ne l’acceptent pas, pas plus que Calibre d’ailleurs.

    La dernière version de TeX, 3,143.141592653 date de janvier 2021. Le format est géré par le groupe des utilisateurs de TeX ou TUG (en) . LaTeX quant à lui est géré par le projet LaTeX (en) . La dernière version date de juin 2024.

    Le SGML et ses petits

    Le SGML, S pour Standard, G pour Generalized, M pour Markup et L pour Langage (langage de balisage généralisé normalisé) possède le numéro de norme ISO 8879:1986. 1986 étant l’année d’obtention du numéro ISO, la première version du SGML étant sortie en 1978. Produit de l’industrie de l’édition, il a adopté, comme TeX, le principe de la séparation complète du fond et de la forme. C’est, en fait, une norme permettant de définir des langages de balisage génériques pour des documents. SGML sera, dès 1984, le format standard des publications officielles des Communautés européennes.

    Ce qui caractérise un document SGML : il doit posséder une « définition du type de document » (DTD ou doctype en anglais). Cette DTD sert à indiquer la structure du document. Et, évidemment le système de balises que l’on va retrouver chez les membres de la famille.

    HTML, sans lequel, possiblement, LinuxFr.org ne serait pas

    Le langage HTML, pour HyperText Markup Language, est un langage de balisage pour l’hypertexte, cette fonctionnalité qui permet de naviguer sur internet. Il a été créé, ou plutôt lancé au début des années 1990 par Tim Berners-Lee qui en a profité pour concevoir au passage la forme des adresses Web que nous connaissons (les URL) et le protocole de communication HTTP.

    Le format HTML est géré par le World Wide Web Consortium (W3C) fondé en 1994 par Tim Berners-Lee. L’objectif du W3C : émettre des normes et des recommandations pour le web.

    La première version de HTML était très limitée : cela n’allait pas plus loin que la structure du texte avec les balises de titres et de listes, et les liens hypertextes.

    En 1999, sort la version 4 (en) qui deviendra une norme ISO en 2000. La norme HTML 4 supporte pleinement le langage de mise en forme CSS (Cascading Style Sheet ou feuilles de style en cascade). Le HTML 4 existe en trois variantes, si on peut dire :

    • le HTML strict qui exclut les éléments de « présentation » puisque qu’il revient au CSS de faire le travail de mise en forme,
    • le HTML transitionnel accepte quelques balises de présentation obsolètes héritées du HTML 3,
    • frameset qui normalise les jeux de cadre, les «frames ».

    La dernière version de HTML est le HTML 5 publié en 2012. Il ne remplace pas le HTML 4.1 : les deux standards coexistent. HTML 5 apporte en plus des fonctionnalités d’animations complexes, multimédia avec de l’audio et de la vidéo, etc. jusque-là assurées notamment par le logiciel privateur Flash. HTML 5 s’est aussi éloigné du SGML.

    XML le futur du HTML

    C’est, en tout cas, ainsi que s’intitulait en 1998 un article (en) de Todd Freter (en) directeur de programme chez Sun Microsystem. Défini comme un sous-ensemble de SGML, « le XML a été conçu pour être facile à mettre en œuvre et interopérable avec SGML et HTML » 11 . De fait les syntaxes HTML et XML sont les mêmes. L’une des différences fondamentales entre les deux était, au départ, qu’il était possible de définir ses propres balises avec XML, mais pas avec HTML. Un comportement qui a été modifié en 2014 pour HTML avec les Web Components (en) .

    XML (eXtensible Markup Language) a été développé par un groupe de travail piloté par le W3C à partir de 1996, avec, comme président, Jon Bosak (en) de Sun Microsystems. Les objectifs, à sa sortie en 1998, étaient les suivants selon la Recommandation du W3C du 10 février 1998 :

    1. XML devrait pouvoir être utilisé sans difficulté sur Internet ;
    2. XML devrait soutenir une grande variété d’applications ;
    3. XML devra être compatible avec SGML ;
    4. Il devrait être facile d’écrire des programmes traitant les documents XML ;
    5. Le nombre d’options dans XML doit être réduit au minimum, idéalement à aucune ;
    6. Les documents XML devraient être lisibles par l’homme et raisonnablement clairs ;
    7. La conception de XML devrait être préparée rapidement ;
    8. La conception de XML sera formelle et concise ;
    9. Il devrait être facile de créer des documents XML ;
    10. La concision dans le balisage de XML est de peu d’importance.

    Qu’en est-il aujourd’hui de ces principes ?

    En fonction de la syntaxe XML du document, s’il est transmis avec le type MIME text/html, il est vu par les navigateurs comme un fichier HTML. En revanche, s’il est transmis avec un type XML MIME, il sera traité comme un document XML. Dans le deuxième cas de figure, des erreurs de syntaxe même mineures empêcheront un document étiqueté XML d’être correctement restitué alors qu’elles seraient ignorées dans la syntaxe HTML. L’objectif 1, n’est donc pas atteint et XML ne remplace définitivement pas HTML. En revanche, XML est effectivement très utilisé : outre les formats ODF et OOXML, c’est le langage sur lequel est basé le format SVG (Scalable Vector Graphics, ou, en français graphique vectoriel adaptable) et c’est le format de référence pour l’échange de données. Mais, pour ce qui est de la lisibilité du format par des yeux humains, elle n’est pas toujours au rendez-vous.

    XML est maintenu par le W3C. La dernière version (en) porte le numéro 1.1, elle est sortie le 29 septembre 2006.

    Langages de balisage léger

    Les langages de balisage léger sont conçus pour être facile à utiliser avec un éditeur de texte. La syntaxe en est simple.

    Le MarkDown, peut-être le plus connu d’entre eux, a été créé en 2004 par le programmeur américain John Gruber ; aidé d’ Aaron Swartz . Il n’a pas subi d’évolution importante depuis. En revanche, il en existe des variantes. John Gruber le définit comme :

    un outil de conversion de texte en HTML destiné à la rédaction Web. Markdown vous permet d’écrire en utilisant un format de texte brut facile à lire et à écrire, puis de le convertir en XHTML (ou HTML) structurellement valide. Daring Fireball (en) .

    Pour en savoir plus sur la syntaxe MarkDown, on peut, très profitablement, se référer au wiki de LinuxFr.org .

    Il en existe d’autres comme txt2tags créé en 2001 ou encore AsciiDoc (en) dont la première version date de 2002. Txt2tags (en) est un logiciel générateur de documents écrit en Python et qui utilise un langage de balisage léger comme source. Quant à AsciiDoc , il se veut un langage particulièrement adapté à la rédaction de documentations techniques. Il existe aussi le langage de balisage du CMS (gestion de contenu web) SPIP , né en 2001.

    L’archivage et la conservation des textes

    Il est ici, évidemment question des formats d’archivage des textes, avec ou sans images, tableaux, formules de mathématiques, etc. Avant d’aborder cette question : une définition s’impose. Il ne s’agit pas des formats dits d’archives de type .zip, .rar, .tar etc. Archiver les textes c’est, dans ce contexte, pouvoir les conserver et y accéder sans avoir besoin de l’application qui a servi à les générer. Et ce soit en conservant la mise en page d’origine, comme pour le PDF, soit en laissant à l’outil de lecture la main pour la mise en page. Chaque format a ses spécificités. Mais de toute façon :

    un bon format de préservation, c’est un bon format tout court. Outils open source nombreux, métadonnées internes bien foutues, démarche collective de normalisation… Bertrand Caron , archiviste numérique à la BnF, janvier 2024.

    EPUB

    L’EPUB, pour Electronic PUBlication, est un format de document numérique qui n’est pas destiné à l’impression. L’une de ses spécificités est, notamment, de laisser à l’utilisatrice ou l’utilisateur le choix du rendu du fichier. Il existe, toutefois, un mode « fixed-layout » qui fige la mise en forme de l’EPUB. Ce mode a été conçu pour les publications qui nécessitent que la mise en page soit respectée, comme certaines publications scolaires. Mais cela réclame une mise en page adaptée aux tailles des écrans des appareils de lecture.

    EPUB a succédé au format OeB (Open eBook). Au départ, géré par l’International Digital Publishing Forum (IDPF) qui sera intégré au W3C en 2017. La première version sort en 2007, suivie, en 2010 par l’EPUB2 et, en 2011, par l’EPUB3. Il a été très vite adopté. Aujourd’hui les deux versions coexistent, l’EPUB2 prédominant encore sur l’EPUB3. Le format est basé sur XML et sur HTML. Un fichier EPUB est un fichier zip qui contient plusieurs fichiers et répertoires dont un dossier META-INF qui contient un fichier container.xml , ce dossier n’apparait pas quand on génère un fichier à partir de Sigil d’ailleurs. Les fichiers de texte sont au format XHTML.

    Qu’apporte l’EPUB3 par rapport à l’EPUB2 ? Les évolutions concernent principalement l’accessibilité et l’intégration de contenus audio ou vidéo. Ainsi les formules de mathématiques qui, en EPUB2 sont converties en images, donc illisibles sans yeux, sont gardées en tant que telles avec EPUB3. Les liseuses ne supportent pas forcément toutes les fonctions, notamment multimédias.

    Il est possible d’y ajouter différents types de marquage ou de verrous : les DRM Adobe, chères et complexes, les DRM LCP, très pratiques pour le prêt des livres en bibliothèque ou encore des filigranes qui n’imposent aucune limitation aux EPUB. L’apposition d’une DRM a un EPUB est, en principe, une décision éditoriale. Il semble néanmoins que certaines librairies éprouvent le besoin d’en rajouter . Il convient donc d’être vigilant quand on achète un EPUB si on veut éviter d’avoir un livre avec une DRM. Le livre numérique représente 10,1 % du chiffre d’affaires de l’édition française en 2023 , ce qui inclut les EPUB et les PDF.

    La version la plus récente du format EPUB et l’ EPUB3.3 sortie en mai 2023. Elle est devenue une Recommandation W3C (en) .

    PDF

    L’objectif du format PDF a contrario de celui de l’EPUB est le respect de la mise en page du fichier qui a servi à le générer. De ce fait, il n’est pas très lisible sur une liseuse ou sur un téléphone.

    La naissance du PDF remonte à 1991 et elle est due à John Warnock cofondateur d’Adobe. La première version de ce format est sortie en 1992. À l’époque c’était assez fou de pouvoir accéder à un fichier avec sa mise en page d’origine sans qu’il soit nécessaire d’avoir l’application qui avait servi à le générer. Il deviendra un standard ouvert géré par l’ISO en 2008, numéro ISO 32000.

    En fait il n’existe pas un, mais plusieurs formats PDF dont :

    • PDF/A pour l’archivage,
    • PDF/E pour les documents techniques,
    • PDF/X pour l’impression,
    • PDF/UA pour l’accessibilité universelle,
    • ou encore des formulaires FDF.

    La version PDF/A-3 permet d’incorporer le fichier d’origine au PDF : dans l’export PDF de LibreOffice, cela s’appelle un PDF hybride. Cela donne un fichier qui pèse deux fois plus lourd, grosso modo, minus le poids des polices embarquées, que le PDF « simple ». Et, si on ouvre le PDF à partir de l’application qui a servi à le créer, ou si on clique sur « Cliquer pour les afficher » (ou équivalent) dans un lecteur de PDF qui le permet, ici Okular, on ouvre le fichier d’origine. Mais, évidemment, quand on le modifie ça ne modifie pas le PDF. Il faut soit générer un nouveau PDF soit l’écraser.

    À savoir, il n’y a que quatorze polices standard PDF, en fait seulement cinq fontes différentes avec leurs variantes, gras, italiques : Courrier, Helvetica, Times Roman, Symbol et Zapf Dingbats. Il est donc très important, quand on génère un PDF d’incorporer les polices au fichier à condition que cela soit permis par la licence des polices . Pour ne pas alourdir le fichier, il est suggéré de n’incorporer que les polices utilisées dans le document. Avec LibreOffice, vous pouvez configurer cela soit en générant le PDF, soit, de préférence, la première fois que vous enregistrez le fichier, c’est dans l’onglet « Police » des propriétés dudit fichier. Si vous utilisez un modèle, la case peut avoir été cochée dans le modèle et il ne sera pas nécessaire de le faire.

    Kurinto une histoire de chasses

    La chasse, en typographie, est l’encombrement d’un caractère : largeur plus approche (espace autour). Pour un même corps de caractère (sa hauteur), elle peut varier selon les polices, ce qui, évidemment, peut changer, voire, chambouler, complètement un document créé avec une police et pour lequel on a changé la typographie. La collection de polices Kurinto (en) a été dessinée à la fois pour couvrir un large éventail de langues et de systèmes d’écriture et dans l’optique de pouvoir remplapcer les polices Microsoft avec des glyphes qui ont la même chasse.

    Si vous cherchez des polices au dessin élégant pour remplacer des fontes comme le couple Arial/Times New Roman, avoir aussi des typographies à chasse fixe ou légèrement fantaisie, l’ensemble de polices Kurinto est un bon choix qui offre en prime une bonne cohérence entre les diverses polices. Elles sont sous licence SIL.

    Déclinaison des noms des polices Kurinto permettant de voir leurs chasses respectives

    Les textes et documents qui ont servi à alimenter cette dépêche

    Les références sont données à peu près dans leur ordre d’apparition dans le texte. Ils sont tous accessibles en ligne et, de préférence, en français. Volontairement, il y a un minimum de références à Wikipédia. Ce n’est pas tout à fait exhaustif, mais ça vous fera déjà pas mal de lecture. Par exemple, je n’ai pas cité le blog de Stéphane Bortzmeyer qui m’a bien servi à défricher le terrain.

    Les formats matériels

    • Sur les rouleaux notamment leur rangement. Le site Rotulus est consacré aux rouleaux médiévaux.
    • Guide pratique du compositeur d’imprimerie , Théotiste Lefèvre, un guide considéré longtemps comme une, si pas LA, référence en matière de typographie et d’imprimerie. Paru en 1855, il fera l’objet de multiples éditions, les dernières en 2000. Aujourd’hui encore, ses pages sur la typographie peuvent servir de références. Théotiste Lefèvre était le fils d’un apprenti compositeur. Il commencera comme ouvrier en imprimerie pour devenir une figure clé du secteur. Sa fille deviendra correctrice. La version du guide donnée en téléchargement sur le site archive.org est d’assez mauvaise qualité. De toute façon, avec le texte brut ou la piètre qualité de la reconnaissance des caractères on perd absolument tout ce qui fait l’intérêt du livre qui donne beaucoup d’exemples.
    • Sur les formats A . Le site donne les dimensions des feuilles de papier en centimètres et en pixels.

    Les formats numériques (texte et archivage)

    La police

    Postambule

    La prochaine dépêche de la série devrait être moins longue (pas difficile) et portera sur le code avant Unicode. Elle parlera donc aussi de football. Comme toujours, vos suggestions sont appréciées.


    1. MOLINIER A. « Les manuscrits et les miniatures », BnF Gallica: Librairie Hachette, 1892. Disponible sur : BnF Gallica en PDF ou en texte brut.

    2. L’exemple est reproduit à partir du petit guide de Charles-Lucien Huard La Typographie .

    3. Pour rappel, un RFC (Request For Comments) est un document qui définit les normes techniques sur les lesquelles s’appuient le réseau Internet .

    4. ANDRÉ Jacques, « Caractères, codage et normalization. De Chappe à Unicode », Document numérique, 2002/3-4 (Vol. 6), p. 13-49. DOI : 10.3166/dn.6.3-4.13-49. .

    5. Les formats de texte , archives.

    6. Wiki de LibreOffice .

    7. À noter qu’OpenOffice, compte tenu de son absence d’évolution ne supporte pas la norme ODF 1.3 .

    8. Office Open XML – Définition .

    9. Pour tout dire, mon gestionnaire d’archives Engrampa est incapable d’ouvrir un fichier .docx et l’explication du site, qui n’est pas un site officiel, me semble très touffue.

    10. Littéralement : « set of macros to let you do many things ». What is the difference between TeX and LaTeX? (en) .

    11. Langage de balisage extensible (XML) 1.0 , Recommandation du W3C, 10 février 1998.

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    • wifi_tethering open_in_new

      This post is public

      linuxfr.org /news/une-histoire-de-formats-il-n-y-a-pas-que-la-taille-qui-compte

    • chevron_right

      NEWSPAPER Revue de presse — juillet 2024

      news.movim.eu / LinuxFRNews · Wednesday, 17 July - 11:10 · 3 minutes

    L’été est là, ainsi que la version estivale de vos magazines préférés. Voici donc un petit panorama, forcément subjectif et parti{e,a}l, de la presse papier sortie récemment.

    Image une de Journal

    Les nouveautés de juillet 2024 :

    • GNU/Linux Magazine France n o 270 crée un émulateur avec l’API Libretro, que s’appelerio « cores » ; Ce numéro est aussi une nouvelle formule. Enfin plutôt un retour aux sources avec cette nouvelle devise en haut du magazine : « Le code est libre, le code est beau » qui devrait rappeler certains souvenirs aux plus vénérables d’entre nous. Et enfin l’arrivée de la coloration syntaxique dans les bouts de code publiés !
    • Linux Pratique n o 144 audite la sécurité de votre système avec Lynis ;
    • MISC magazine n o 134 contourne un mécanisme de supervision des EDR via les appels système directs et indirects ;
    • MISC hors-série n o 29 s’intéresse à la sécurité d’un point de vue radiocommunications ;
    • Hackable n o 55 vous propose de réaliser un ordinateur 8 bits complet en VHDL.

    Les sommaires des numéros sortis depuis la précédente revue de presse

    Mosaïque des couvertures GLMF 270 Mosaïque des couvertures LP144
    Mosaïque des couvertures MISC134 Mosaïque des couvertures HK55 Mosaïque des couvertures MISC HS 29

    GNU/Linux Magazine numéro 270

    Au sommaire de ce numéro de juillet – août 2024 :

    • Trente ans d’open source… pour en arriver là ;
    • Créer un émulateur avec l’API Libretro ;
    • Le temps sous Linux - deuxième volet ;
    • Les codes fantastiques : rembourrage ;
    • NetBSD et Boot PVH : en cours d’étude…
    • Une histoire des piles et de leur protection.

    Linux Pratique numéro 144

    Au sommaire de ce numéro de juillet – août 2024 :

    • JAN : tirez parti de votre IA open source ;
    • Écrire des tests unitaires orientés systèmes et services avec Testinfra ;
    • Réaliser un audit de sécurité avec Lynis ;
    • ntfy.sh : installez un service de notification pour suivre les événements de votre SI ;
    • Maintenance d’une instance PostgreSQL ;
    • Les commandes liées au temps ;
    • Comprendre jq, l’expert du traitement JSON.

    MISC Magazine numéro 134

    Au sommaire de ce numéro de juillet – août 2024 :

    • 10 ans de NoLimitSecu
    • Contournement d’un mécanisme de supervision des EDR via les appels système directs et indirects ;
    • Démystification du reverse-engineering d’applications Android ;
    • Techniques des injections de prompt, un nouvel eldorado de menaces dirigées vers l’IA ;
    • CVE-2022-21340 : ou comment ouvrir les JAR sans en mettre partout ;
    • Comment débuter l’analyse d’une famille de malwares ;
    • Registre privé Docker : s’attaquer au cycle de développement d’une application ;
    • Délégation d'autorisation avec les jetons Biscuit.

    MISC hors‑série numéro 29

    Au sommaire de ce numéro hors-série de juin — juillet 2024 :

    • Entretien avec Martien Untersinger, auteur de « Espionner, mentir, détruire – Comment le cyberespace est devenu un champ de bataille »
    • Analyse des firmwares FortiGate
    • Dossier : Sécurité & Radiocommunications
      • Mon premier laboratoire de sécurité radio
      • Sécurité électromagnétique : panorama des modèles de menaces
      • Communication cachée via le champ magnétique émis par un ordinateur
      • À l’écoute des messages transmis par satellite en orbite basse : Iridium
    • Démystification de la gestion des risques avec EBIOS RM.

    Hackable numéro 55

    Au sommaire de ce numéro de juillet – août 2024 :

    • Alimentation de laboratoire ALIENTEK DP100 : petite, mais costaud ;
    • Un oscilloscope à pédale ;
    • Concevoir, mettre en place et bidouiller un environnement basé sur le protocole industriel Modbus ;
    • Mon premier projet FPGA : un ordinateur 8 bits complet en VHDL ;
    • Pimp my LED counter, les performances de l’addition ;
    • Asterisk, RTC, PPP, CPC 464… Surfons comme en 1989 !

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    • wifi_tethering open_in_new

      This post is public

      linuxfr.org /news/revue-de-presse-juillet-2024

    • chevron_right

      L’Union Européenne doit poursuivre le financement des logiciels libres

      news.movim.eu / LinuxFRNews · Tuesday, 16 July - 21:50 · 5 minutes

    De nombreux projets de logiciel libre (*) bénéficient du programme de financement européen Next Generation Internet (NGI). Or celui-ci est en danger. Pour prendre conscience de l'effet éventuel, il suffit de se rappeler que ce programme est fréquemment mentionné dans de nombreuses conférences du Libre, associé à de nombreux projets communautaires et relié à des éléments libres essentiels (voir l'étiquette next_generation_internet et la liste des signataires).

    (*) ce n'est le cas de LinuxFr.org et cela ne change rien à notre propos.

    Pour tous les projets libres bénéficiant de ce précieux soutien, l'association LinuxFr signe la lettre publique ci-dessous, et vous invite à contacter vos parlementaires pour rappeler l'importance du programme et le pérenniser.

    Cette lettre a été publiée initialement par les petites singularités . Si vous souhaitez la signer, merci de la publier sur votre site et de compléter le tableau . Au moment de notre signature, il comprend les petites singularités, John Livingston , Inventaire , CryptPad , Acoeuro , Fedicat , Fidus Writer , French Data Network , Framasoft , Code for France , YunoHost , Deuxfleurs , Parinux , Club Linux Nord-Pas de Calais , OW2 , Radically Open Security , multi , Spare Cores , Iloth , Tetaneutral.net , OpenStreetMap France , SocialHub ActivityPub Community , Interpeer Project , VerifAI project , WordPress Francophone (WPFR) , Restoration.software , Librecast Project , Open Knowledge Foundation , NextGraph .

    Sommaire

    Lettre ouverte à la Commission Européenne

    Depuis 2020, les programmes Next Generation Internet ( NGI ), sous-branche du programme Horizon Europe de la Commission Européenne financent en cascade (notamment, via les appels de NLnet) le logiciel libre en Europe. Cette année, à la lecture du brouillon du Programme de Travail de Horizon Europe détaillant les programmes de financement de la commission européenne pour 2025, nous nous apercevons que les programmes Next Generation Internet ne sont plus mentionnés dans le Cluster 4.

    Les programmes NGI ont démontré leur force et leur importance dans le soutien à l'infrastructure logicielle européenne, formant un instrument générique de financement des communs numériques qui doivent être rendus accessibles dans la durée. Nous sommes dans l'incompréhension face à cette transformation, d'autant plus que le fonctionnement de NGI est efficace et économique puisqu'il soutient l'ensemble des projets de logiciel libre des plus petites initiatives aux mieux assises. La diversité de cet écosystème fait la grande force de l'innovation technologique européenne et le maintien de l'initiative NGI pour former un soutien structurel à ces projets logiciels, qui sont au cœur de l'innovation mondiale, permet de garantir la souveraineté d'une infrastructure européenne. Contrairement à la perception courante, les innovations techniques sont issues des communautés de programmeurs européens plutôt que nord-américains, et le plus souvent issues de structures de taille réduite.

    Le Cluster 4 allouait 27.00 millions d'euros au service de :

    • "Human centric Internet aligned with values and principles commonly shared in Europe" ;
    • "A flourishing internet, based on common building blocks created within NGI, that enables better control of our digital life" ;
    • "A structured eco-system of talented contributors driving the creation of new internet commons and the evolution of existing internet commons".

    Au nom de ces enjeux, ce sont plus de 500 projets qui ont reçu un financement NGI0 dans les 5 premières années d'exercice, ainsi que plus de 18 organisations collaborant à faire vivre ces consortia européens.

    NGI contribue à un vaste écosystème puisque la plupart du budget est dévolu au financement de tierces parties par le biais des appels ouverts ( open calls ). Ils structurent des communs qui recouvrent l'ensemble de l'Internet, du matériel aux applications d'intégration verticale en passant par la virtualisation, les protocoles, les systèmes d'exploitation, les identités électroniques ou la supervision du trafic de données. Ce financement des tierces parties n'est pas renouvelé dans le programme actuel, ce qui laissera de nombreux projets sans ressources adéquates pour la recherche et l'innovation en Europe.

    Par ailleurs, NGI permet des échanges et des collaborations à travers tous les pays de la zone euro et aussi avec les widening countries 1 , ce qui est actuellement une réussite tout autant qu’un progrès en cours, comme le fut le programme Erasmus avant nous. NGI est aussi une initiative qui participe à l’ouverture et à l’entretien de relation sur un temps plus long que les financements de projets. NGI encourage également à l'implémentation des projets financés par le biais de pilotes, et soutient la collaboration au sein des initiatives, ainsi que l'identification et la réutilisation d'éléments communs au travers des projets, l'interopérabilité notamment des systèmes d'identification, et la mise en place de modèles de développement intégrant les autres sources de financements aux différentes échelles en Europe.

    Alors que les États-Unis d’Amérique, la Chine ou la Russie déploient des moyens publics et privés colossaux pour développer des logiciels et infrastructures captant massivement les données des consommateurs, l’Union Européenne ne peut pas se permettre ce renoncement. Les logiciels libres et open source tels que soutenus par les projets NGI depuis 2020 sont, par construction, à l’opposée des potentiels vecteurs d’ingérence étrangère. Ils permettent de conserver localement les données et de favoriser une économie et des savoirs-faire à l’échelle communautaire, tout en permettant à la fois une collaboration internationale. Ceci est d’autant plus indispensable dans le contexte géopolitique que nous connaissons actuellement. L’enjeu de la souveraineté technologique y est prépondérant et le logiciel libre permet d’y répondre sans renier la nécessité d’œuvrer pour la paix et la citoyenneté dans l’ensemble du monde numérique.

    Dans ces perspectives, nous vous demandons urgemment de réclamer la préservation du programme NGI dans le programme de financement 2025.


    1. Tels que définis par Horizon Europe, les États Membres élargis sont la Bulgarie, la Croatie, Chypre, la République Tchèque, l’Estonie, la Grèce, la Hongrie, la Lettonie, la Lituanie, Malte, la Pologne, le Portugal, la Roumanie, la Slovaquie et la Slovénie. Les pays associés élargies (sous conditions d’un accord d’association) l’Albanie, l’Arménie, la Bosnie-Herzégovine, les Îles Féroé, la Géorgie, le Kosovo, la Moldavie, le Monténégro, le Maroc, la Macédoine du Nord, la Serbie, la Tunisie, la Turquie et l’Ukraine. Les régions élargies d’outre-mer sont: la Guadeloupe, la Guyane Française, la Martinique, La Réunion, Mayotte, Saint-Martin, Les Açores, Madère, les Îles Canaries.

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    • wifi_tethering open_in_new

      This post is public

      linuxfr.org /news/l-union-europeenne-doit-poursuivre-le-financement-des-logiciels-libres

    • chevron_right

      Revue de presse de l’April pour la semaine 28 de l’année 2024

      news.movim.eu / LinuxFRNews · Monday, 15 July - 11:08 · 2 minutes

    Cette revue de presse sur Internet fait partie du travail de veille mené par l’April dans le cadre de son action de défense et de promotion du logiciel libre. Les positions exposées dans les articles sont celles de leurs auteurs et ne rejoignent pas forcément celles de l’April.

    [Silicon] L'avenir de l'IA passe par l'open source

    ✍ Jan Wildeboer, le jeudi 11 juillet 2024.

    Les lignes de code source ouvertes permettent aux utilisateurs de comprendre et de contrôler comment les algorithmes d’IA fonctionnent et quelles sources sont exploitées, ce qui renforce la confiance dans la technologie.

    [ZDNET] Linuxfr.org a 26 ans: bon anniversaire à une belle communauté du Libre

    ✍ Thierry Noisette, le jeudi 11 juillet 2024.

    117.000 contenus et 1,91 million de commentaires ont été mis en ligne dans le quart de siècle plus un an que vient de passer ce très utile site dédié aux logiciels libres et sujets proches.

    [cio-online.com] IA générative Open Source: méfiez-vous des imitations

    ✍ Reynald Fléchaux, le mercredi 10 juillet 2024.

    Nombre de modèles d’IA se revendiquent ouverts. Mais ce qualificatif masque des réalités très différentes, souligne une étude.

    [Le Monde Informatique] Plagiat de code: Une plainte contre GitHub Copilot en partie déboutée

    ✍ Jacques Cheminat, le mardi 9 juillet 2024.

    Dans l’action collective menée par des développeurs contre l’assistant Copilot de GitHub, un juge a rejeté l’accusation principale de violation des termes des licences open source. Il laisse par contre la porte ouverte à deux autres charges à étayer.

    [Alliancy] Open source pour réduire l'obsolescence matérielle

    ✍ Rémy Marrone, le lundi 8 juillet 2024.

    Les entreprises et les utilisateurs finaux se saisissent encore peu ou mal de l’open source. Les règles sont parfois mal connues et les clichés encore nombreux

    Commentaires : voir le flux Atom ouvrir dans le navigateur

    • wifi_tethering open_in_new

      This post is public

      linuxfr.org /news/revue-de-presse-de-l-april-pour-la-semaine-28-de-l-annee-2024