L’harmonisation de données et pourquoi l’automatiser

multiple data converging into a computer_icon

Dans cet article sur l'harmonisation des données, nous allons définir ce qu'elle est et où elle intervient dans le processus d'enregistrement des données.

Voici un schéma qui résume les concepts qui seront abordés dans cet article pour que vous puissiez vous y référer au cours de votre lecture. Il est adapté en mettant l'accent sur l'harmonisation des données, dans un contexte d'utilisation d'instruments de mesure.

schéma qui illustre la différence entre l'harmonisation de données de plusieurs dataloggers versus un système d'acquisition de données

La journalisation de données

La journalisation est définie comme un enregistrement chronologique, dans un fichier ou une base de données, d’opérations effectuées sur un système informatique. (1)

La chronologie n’a pas à être établie avec une estampille temporelle (timestamp), elle peut être fournie par un ordre numérique quelconque. La journalisation des données est l’action au cœur d’un enregistreur de données et d’un système d’acquisition de données (DAQ). Après avoir recueilli les données, il est nécessaire de les extraire des capteurs. Avec un enregistreur de données (datalogger), il y aura production d’un fichier par capteur. Avec un système DAQ, il y aura un seul fichier contenant l’ensemble des données de tous les capteurs.  

L’harmonisation des données: une définition

Au sens très large, en particulier dans le secteur biomédical, l’harmonisation de données consiste à combiner des études, des expériences, des formats de fichier différents ou des bases de données. Afin de les combiner, il faut établir des paramètres communs. (2)

Il existe des compagnies ou des logiciels pour faire de telles harmonisations de données. Sinon, c’est une tâche manuelle ardue, fastidieuse et à haut risque d’erreurs.

L’harmonisation des données appliquée à la métrologie

L’harmonisation des données implique de “[trad.] rassembler différents types, niveaux et sources de données, qui représentent la mesure du ou des mêmes construits latents, de manière à les rendre compatibles et comparables”. (3)

Bref, il s’agit de combiner les mesures en fonction de paramètres communs. Pour harmoniser les données, il faut que la méthode de collecte et les données pré-existantes soient compatibles. Dans le cas de la métrologie, cette compatibilité peut être établie selon l’estampille temporelle et l’unité de mesure. 

Pourquoi automatiser l’harmonisation de données? 

Voici une mise en situation où nous avons trois types de mesure différents, avec trois instruments de mesure faisant partie d’un système supportant l’harmonisation de données.

incubator with 3 measuring instruments and a computer logging them

Dans notre incubateur à CO2, nous voulons nous assurer que la température, le taux d’humidité et la concentration de CO2 sont optimaux pour la croissance de nos cellules.

Si nous avons des enregistreurs de données, chaque instrument devra être paramétré individuellement. Ensuite, les données recueillies seront transférées sur un ordinateur et elles devront être alignées manuellement. Pour faire l’alignement, l’estampille temporelle est un paramètre important. Attention à ce que la journalisation commence au même moment et que la fréquence d’échantillonnage soit la même pour les trois instruments. Cela facilitera l'harmonisation des données. Aussi, peut-être que les fichiers produits par chacun des capteurs ne seront pas du même type. Quelques notions de programmation seront nécessaires ici pour aligner les données.

Avec un système DAQ, la journalisation des données des capteurs débute en même temps, avec un fréquence d’échantillonnage définie pour la durée de l’expérience. Une seule action pour les trois instruments. La mise en place de la tâche de mesurage est donc beaucoup plus rapide qu’avec plusieurs instruments différents.

Petite mise en garde. Tous les systèmes DAQ ne permettent pas l’harmonisation des données de différents types (p.ex. température, humidité relative et niveau de dioxyde de carbone). Il s’agit d’un point à vérifier lors de l’achat. 

Avec un système DAQ permettant l’harmonisation de données, il y aura création d’un seul fichier contenant l’ensemble des données alignées. Grâce au logiciel, la journalisation et l’harmonisation se font simultanément. Aucune notion de programmation n’est nécessaire ici et les heures investies pour produire un fichier de données alignées sont réduites à néant

Dracal et l’harmonisation de données

Avec le logiciel d’acquisition de données DracalView, chaque instrument de mesure Dracal fait partie d’un écosystème Mix & match parfaitement harmonisé. Chacun des capteurs USB journalise les données avec une estampille temporelle synchronisée, permettant l’automatisation de l’harmonisation des données. De plus, les unités de mesure sont uniformisées pour une grandeur donnée. Ainsi, reprenant l’exemple de notre incubateur à CO2 et des trois mesures requises, un seul fichier de journalisation sera généré avec DracalView, celui-ci contenant une seule ligne par estampille temporelle pour toutes les mesures prises simultanément.

De plus, l'utilisation du SensGate permet d'obtenir des données harmonisées non seulement à partir des capteurs branchés sur celui-ci, mais aussi à partir de tous les capteurs connectés au même réseau sur différentes stations d'enregistrement à distance SensGate. Si vous êtes intéressé(e) par la mise en place de votre propre sous-réseau de capteurs, nous vous invitons à lire la procédure simple pour le faire.

En bref

L’harmonisation de données métrologiques est leur combinaison et leur alignement selon des paramètres communs dans un seul fichier. Ces paramètres sont souvent le temps et les unités de mesure. L’harmonisation peut être ardue ou simple, dépendamment des outils d’automatisation utilisés.

Nous avons vu qu'un système complet d'acquisition de données, tel que celui proposé par Dracal Technologies, comprenant des instruments de mesure, une station d'enregistrement à distance et une solution logicielle, automatise l'harmonisation des données et permet d'économiser énormément de temps pour aligner chaque fichier provenant de chaque enregistreur de données, même pour différents types de mesures.

Si vous souhaitez discuter de votre projet avec nous, veuillez nous écrire!

 

Références:

  1. OQLF (2020). journalisation. [en ligne] Grand dictionnaire terminologique. Disponible au: https://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=8355561 [Accédé 28 Sep. 2022].
  2. Tetrascience.com. (2022). Scientific Data Harmonization | TetraScience. [en ligne] Disponible au: https://www.tetrascience.com/platform/data-harmonization [Accédé 28 Sep. 2022].
  3. NIHR | Cambridge Biomedical Research Centre (2012). Harmonisation. [en ligne] DAPA Measurement Toolkit. Disponible au: https://dapa-toolkit.mrc.ac.uk/concepts/harmonisation [Accédé 28 Sep. 2022].‌