Développement Incrémental Rapide de Logiciels Temps-Réel Embarqués

Résumé

Cet article montre comment tout concepteur de logiciels temps-réel enfouis pour microcontrôleurs (MCU) ou processeurs de traitement du signal (DSP), insatisfait comme moi des lourdeurs et coûts de leurs environnements intégrés de développement commerciaux, peut créer à peu de frais ses propres environnements hôtes de développement incrémental, qui lui permettront une testabilité aisée et donc des cycles de mise au point rapides grâce à une interactivité exceptionnelle avec son matériel cible et son logiciel temps-réel embarqué.

Mythologie : langages dits "compilés" ou "interprétés"

Depuis les débuts de l'informatique, deux conceptions différentes du cycle de développement se sont cotoyées :

d'un coté, les langages dits "compilés" (COBOL, FORTRAN, Pascal, C, Ada, C++, Java, pour ne citer que les plus connus) utilisent des chaînes de compilation composées de préprocesseur, compilateur, assembleur, archiveur, lieur, et d'autres outils de chargement et de débogage, où chacun d'eux, à partir de fichiers sources édités par le développeur ou de fichiers intermédiaires produits par les outils prédécesseurs, produit des fichiers pour les outils successeurs, le tout séquencé, dans le meilleur des cas, par un interpréteur du graphe de dépendance entre fichiers (habituellement nommé "makefile") décrit par le développeur ou automatiquement généré par un des outils ; ces langages sont caractérisés par une séparation totale entre d'une part l'exécution de la chaîne de compilation, et d'autre part l'exécution/débogage du programme compilé, à chaque cycle de mise au point du programme (1: modification des sources, 2: compilation/assemblage/lien, 3: chargement/exécution/débogage).
d'un autre coté, les langages dits "interprétés" (LISP, Forth, APL, Basic, Smalltalk, Scheme, Perl, Camel, Python, Tcl, et autres "shells" ou "ligne de commande" des systèmes d'exploitation, pour ne citer que les moins méconnus), de fait très minoritairement utilisés par rapport aux langages dits compilés, sont caractérisés par la coexistence, dans le même environnement d'exécution, du compilateur et du programme compilé, ce qui permet de compiler des bouts de programme supplémentaires sans avoir à recompiler/lier tout le programme, et de les exécuter aussitôt après pour les tester sans avoir à recharger tout le programme ; cette alternance immédiate entre compilation/lien incrémental et exécution/test incrémental, de plus sans perte de continuité du contexte d'exécution entre cycles successifs, procure une interactivité et une testabilité d'un confort et d'une productivité insoupçonnés par les développeurs inconditionnels des langages dits compilés.

Cette comparaison, de mon point de vue, montre que la différence entre langages dits compilés et langages dits interprétés se situe moins au niveau des techniques de traduction des langages sources, rédigés par un humain, en code machine (traduction faite une seule fois pour plusieurs exécutions du code machine dans le cas des langages compilés, ou faite à chaque exécution dans le cas des langages interprétés), qu'au niveau de l'interactivité procurée par les langages interprétés, alors que les langages compilés offrent des quantités d'options de paramétrage des outils de leur chaîne de compilation.

Les langages dits interprétés sont réputés moins rapides que les compilés, moins à cause du potentiel d'optimisations plus globales (rarement exploité, d'après mes constatations) des langages compilés, qu'à cause du surcoût d'interprétation soit directement du code source, soit du code intermédiaire que certains langages dits interprétés génèrent, autant pour des raisons de portabilité que de compacité (comme c'est aussi le cas par exemple du "P-code" Pascal ou de la "machine virtuelle" Java). Cette réputation est controversée (tout comme les programmes de test choisis pour comparer les performances), en particulier depuis l'introduction des techniques de compilation "à la volée" qui génèrent du code machine proche de celui des langages dits compilés, à partir du code source (cf par exemple FreeForth du même auteur) ou intermédiaire (cf compilateurs "Just-In-Time" de Smalltalk et Java), lors de son chargement depuis la mémoire lente de stockage non volatile (disque ou ROM ou flash) vers la memoire rapide d'exécution (RAM).

Allocation mémoire et résolution des références

Compilateurs comme interpréteurs ont pour principale tâche de traduire les noms/symboles choisis par le développeur en adresses mémoire fixes (dans le cas des variables globales ou des destinations d'instructions de saut) ou relatives (à un pointeur de pile, dans le cas de variables locales, ou à une adresse de base, dans le cas de champs de structures de données).

Les langages compilés accomplissent cette tâche en plusieurs "passes" : analyse syntaxique et grammaticale du source traduit en un arbre, simplifié par réduction des expressions constantes et factorisation des sous-expressions communes, allocation des registres, assemblage de sections séquentielles de code machine et de données, résolution des adresses des instructions de saut et des variables, et génération finale d'un fichier chargeable en mémoire vive pour exécution.

Les langages interprétés accomplissent cette tâche en une seule passe, au fur et à mesure de "l'interprétation" du source : l'adresse d'une variable ou de de la destination d'une instruction de saut est définie lors de l'analyse du source qui la déclare, car l'allocation mémoire se fait au fur et à mesure de l'analyse du source, souvent avec des pointeurs d'allocation code et données séparés, surtout dans le cas où ces deux mémoires sont distinctes (par exemple flash et ram, ou dans le cas de machines de type "Harvard").
Les références arrières, aux addresses de variables ou de saut déjà déclarées, sont résolues sans problème puisque déjà connues. Les références avant ne sont généralement pas admises pour les variables et pour les points d'entrée de fonctions/sous-programmes (qu'il est en général facile de déclarer avant utilisation) ; pour les structures de contrôle, l'addresse de compilation d'une instruction de saut avant est mémorisée, puis retrouvée lors de l'analyse ultérieure du symbole déclarant l'addresse destination du saut, ce qui permet alors de résoudre l'argument de l'instruction de saut avant. Pour supporter l'imbrication des structures de contrôle, les addresses des instructions de saut avant à résoudre sont mémorisées sur un pile de compilation LIFO ("Last-In, First-Out" = dernière empilée, première dépilée).
Cette technique de compilation "à la volée" des structures de contrôle est particulièrement rapide, et aussi simple à comprendre qu'à implémenter.

Syntaxe, Grammaire, Compilation

Chaque langage a sa propre syntaxe, nécessitant un analyseur lexical plus ou moins complexe. Celle des dialectes Forth est particulièrement simple : les unités lexicales, appelées "mots" en Forth, sont séparées par des blancs (espace, saut de ligne, etc.) et sont composées de tous caractères exceptés les blancs ; chaque mot prend les arguments dont il a besoin sur une pile LIFO "de données", où il retourne aussi ses résultats.

Chaque langage a sa propre grammaire, nécessitant un analyseur grammatical plus ou moins complexe. Celle du Forth est particulièrement simple : chaque mot est défini, et associé dans un dictionnaire, par une phrase appelée "définition" (ou "sous-programme" ou "fonction" pour les autres langages) composée d'une séquence de mots, dont l'exécution séquentielle peut être interrompue par des sauts, soit à l'intérieur d'une même définition (par des mots de saut avant ou arrière, conditionnel ou non), soit entre définitions (pour l'appel et le retour de sous-programme).

Chaque langage a son propre compilateur, plus ou moins complexe en fonction des optimisations qu'il tente d'effectuer. Celui du Forth est constitué simplement d'une boucle principale isolant les mots du source et les compilant l'un après l'autre, en fonction du résultat de la recherche dans le dictionnaire :

les mots marqués dans le dictionnaire comme "immédiats" sont directement exécutés (dans d'autres langages on appelle aussi cela des "macros") ; le programmeur peut en définir de nouveaux, et ainsi étendre le compilateur, qui est en fait principalement constitué de ces mots immédiats
les autres mots du dictionnaires sont compilés sous forme d'un appel de sous-programme à leur définition
les mots qui ne sont pas trouvés dans le dictionnaire sont considérés par défaut comme des litéraux, convertis en fonction de leur forme litérale, et compilés dans la définition de telle manière qu'à l'exécution la valeur convertie (ou son adresse et sa longueur dans le cas d'un litéral de longueur variable, comme par exemple une chaîne de caractères) soi(en)t mise(s) sur la pile de données à disposition du mot suivant
les literaux dont la conversion échoue provoquent un message d'erreur et un arrêt de la compilation

Développement incrémental

Le développement d'un programme consiste en général à étendre le langage de programmation en ajoutant à son dictionnaire de nouveaux mots, dont la définition est composée de mots déjà présents dans le dictionnaire (c'est-à-dire soit précédemment définis, soit "déclarés" auparavant pour permettre au développeur de définir les mots dans l'ordre qui lui convient).

Le test d'un programme est plus aisé quand ses composants ont été préalablement testés. Bien tester un programme, ou un de ses composants, nécessite sa mise en interaction avec tous ses contextes d'exécution possibles.

Le test est malcommode et coûteux avec un langage compilé et son débogueur. Pour bien faire il faut souvent écrire pour le test plus de code (qu'il faut tester aussi) que pour le composant testé, et comme tout débogueur nécessite l'arrêt d'un programme pour en observer l'état, on ne peut l'utiliser pour les tests en temps réel.

Le test est plus aisé avec un environnement de développement incrémental, qui permet l'édition/exécution interactive (ou en fichier de traitement par lot pour les tests automatisés) de petites définitions préparant chacune un contexte d'exécution (souvent en ne modifiant qu'une petite partie du contexte d'exécution courant), puis exécutant en temps réel le mot à tester dans ce contexte, puis affichant le résultat du test (ou le vérifiant et affichant le cas échéant un message d'erreur, pour les tests automatisés).

Ces petites définitions de test ne sont jamais utilisées comme composants du code à tester, et elles ne sont normalement exécutées qu'une seule fois (sauf si le test échoue et nécessite une modification du mot testé, et donc une nouvelle exécution du test), donc chacune peut être exécutée aussitôt compilée, et son code compilé peut être oublié/effacé aussitôt exécuté, sans qu'il soit nécessaire de lui associer un nom dans le dictionnaire : c'est pourquoi FreeForth nomme ces petites définitions temporaires "définitions anonymes", qui lui donnent toute son interactivité.

Note : les autres dialectes Forth procurent leur interactivité non pas au moyen de définitions anonymes, mais au moyen d'un "mode interprétation" qui exécute chaque mot aussitôt trouvé dans le dictionnaire, ce qui exclut l'utilisation des mots immédiats réservés au "mode compilation" (dont ceux des structures de contrôle, sauf ceux dits "STATE smart" plus complexes qui se comportent différement en fonction du mode, contenu dans la variable "STATE"), et ce qui fait que l'exécution d'une phrase en mode interprétation prend plus de temps que l'exécution de la même phrase compilée, ce qui biaise les tests en temps réel.

Développement incrémental ombilical

Il est rare de nos jours qu'un MCU ou un DSP soit embarqué avec des ressources matérielles suffisantes pour héberger son propre système de développement, qui est plus confortablement hébergé par un PC "hôte", communicant par un lien "ombilical" avec le MCU ou DSP "cible", qui exécute un "moniteur" permettant principalement de charger, dans la mémoire du processeur cible, du code compilé par le PC hôte, et de lancer son exécution lorsqu'il s'agit de code de test (dont l'exécution se terminera par un retour au moniteur).

Le code exécutable du moniteur ne peut être ni chargé ni testé au moyen du moniteur lui-même : il doit donc être le plus simple possible pour que sa conception nécessite le minimum de mise au point, et doit être chargé en mémoire cible par les moyens conçus par le constructeur du processeur cible (programmation d'une EPROM externe, ou utilisation d'une liaison JTAG ou d'un programme "bootloader" en ROM interne du processeur cible).

Moniteur minimal

Le moniteur le plus simple que j'aie conçu comprend :

un programme exécuté au démarrage ("reset") :
1. initialiser le lien ombilical de communication avec le PC hôte
2. envoyer un symbole "prêt" puis recevoir une adresse mémoire cible
3. exécuter un appel de sous-programme à l'adresse reçue
4. reprendre au point 2.
au moins un sous-programme "écrire" :
1. recevoir une adresse mémoire cible et une donnée
2. stocker la donnée reçue à l'adresse reçue
3. exécuter un retour de sous-programme
luxueusement, un sous-programme "lire" (qu'on pourrait aussi charger au moyen du sous-programme "écrire") :
1. recevoir une adresse mémoire cible à lire
2. lire cette adresse mémoire et renvoyer la donnée lue
3. exécuter un retour de sous-programme

Pour charger la mémoire cible, pour chaque adresse mémoire à charger il faut :

attendre d'avoir reçu le symbole "prêt"
envoyer l'adresse du sous-programme "écrire"
envoyer l'adresse et la donnée à y écrire

Une fois la mémoire chargée avec du code à tester et un sous-programme de test, il faut :

attendre d'avoir reçu le symbole "prêt"
envoyer l'adresse du sous-programme de test
observer l'effet de bord attendu du sous-programme de test

Pour observer des effets de bord dans la mémoire cible, pour chaque adresse mémoire à observer, il faut :

attendre d'avoir reçu le symbole "prêt"
envoyer l'adresse du sous-programme "lire"
envoyer l'adresse à lire puis recevoir la donnée lue

La trivialité de ce moniteur minimal, facile à coder et à mettre au point, se paye cependant par un volume de communication important :

pour chaque adresse écrite, il faut recevoir le symbole "prêt", puis envoyer 2 adresses et 1 donnée
pour chaque adresse lue, il faut recevoir le symbole "prêt", puis envoyer 2 adresses et recevoir 1 donnée

C'est pourquoi je lui préfère un moniteur à peine moins simple, mais plus économe en volume de communication, donc plus rapide.

Moniteur rapide

Le moniteur que j'ai réalisé dans tous mes environnements de développement incrémental ombilical comprend un seul programme exécuté au démarrage :

initialiser le lien ombilical de communication avec le PC hôte
envoyer un symbole "prêt" puis recevoir une adresse mémoire cible A et un nombre N (d'adresses consécutives)
si N=0, exécuter un appel de sous-programme à l'adresse A, puis reprendre en 2.
sinon si le MSBit de N (ou son LSBit pour les mémoires par octet chargées par paires d'octets) est à 0, recevoir N données et les écrire dans la mémoire cible à partir de l'adresse A, puis reprendre en 2.
sinon (bit à 1), envoyer N (avec le bit à 0) données lues dans la mémoire cible à partir de l'adresse A, puis reprendre en 2.

À suivre... CL20100626