Data Engineer vs Data Scientist : tout savoir sur ces métiers de la tech

L’essor du Big Data fait naître de nouveaux métiers dont le but est de collecter, analyser et exploiter des données. Les missions du Data Engineer et du Data Scientist sont complémentaires. Le premier crée des systèmes et des bases de données. Le second les utilise pour aider les organisations à prendre des décisions stratégiques. Vous êtes intéressé par ces métiers ? Vous êtes au bon endroit ! On vous dit tout sur la profession de Data Engineer et celle de Data Scientist.

Les missions du Data Engineer et du Data Scientist : des rôles complémentaires

Les deux métiers interviennent à des moments différents dans le processus de création et d’exploitation des données.

Les missions du Data Engineer (ou ingénieur des données)

Le ou la Data Engineer est un développeur informatique. Son rôle est d’organiser et d’industrialiser la collecte et la mise à disposition des données dans une organisation. Il est donc responsable de la création des architectures data et de la production de données.

Les principales activités du Data Engineer sont les suivantes :

  • Acheminer de la donnée. Il recueille au préalable les besoins des utilisateurs de données puis développe des solutions de collecte et de stockage. Il travaille à partir de données brutes originaires de multiples sources. Il est aussi responsable du bon fonctionnement des traitements de données en conduisant des tests et en assurant la maintenance de ses solutions.
  • Mettre à disposition des données exploitables par les professionnels de la data (Data Analysts, Data Scientists notamment). Cette mission comprend le « nettoyage » des données brutes et leur gestion conformément aux directives du RGPD.
  • Mettre en production des modèles statistiques dans les applications. 
  • Cartographier et documenter les données disponibles selon les entreprises.

Le Data Engineer peut être directement recruté par une entreprise, travailler pour un prestataire de services ou exercer en freelance.

Les missions du Data Scientist

Le Datat Scientist est un professionnel des statistiques, du développement informatique et du marketing. On le trouve dans de multiples secteurs d’activité comme l’informatique, la finance, les assurances, l’e-commerce ou la grande distribution. Son rôle consiste principalement à :

  • Identifier des outils d’analyse.
  • Recueillir et analyser les données les plus pertinentes pour l’entreprise.
  • Utiliser des algorithmes d’apprentissage automatique dont le deep learning et le machine learning. Cette activité est fortement impactée par les progrès de l’intelligence artificielle.
  • Mettre en place des programmes d’analyse et élaborer des modèles de prédiction.
  • Présenter le résultat de son travail aux décideurs de l’entreprise de façon claire et précise.

Les méthodes et techniques employées par les Data Scientist varient peu d’un secteur à l’autre. Toutefois, la nature des activités de l’entreprise est déterminante dans la finalité de ses missions. Par exemple, dans le secteur bancaire et financier, il s’agira de concevoir des modèles de détection de fraudes. Dans le commerce et le marketing, il sera attendu du Data Scientist qu’il participe à l’élaboration de modèles de recommandation d’achat.

Les qualités et compétences attendues d’un Data Engineer et d’un Data Scientist

Le Data Engineer

Le rôle du Data Engineer, au début de la chaîne de traitement des données, réclame des qualités personnelles (soft skills), en particulier :

  • La capacité à travailler en équipe : L’ingénieur de données est placé sous l’autorité d’un chef de projet data ou informatique ou d’un architecte big data. De plus, son travail doit répondre aux attentes de l’équipe data, les Data Analyst et les Data Scientist. Ceci requiert de bonnes capacités relationnelles pour se coordonner avec l’ensemble de ces acteurs.
  • La rigueur.
  • Savoir prendre des décisions importantes.
  • Un très bon esprit analytique et synthétique.
  • Des capacités managériales si le Data Engineer se trouve à la tête d’une équipe. 

Ses compétences techniques sont recherchées par les employeurs. Un Data Engineer améliore son employabilité s’il maîtrise :

  • Des outils comme Oracle, SAP, MysSQL, Cassandra, Tak, Redis, Scoop et PostgreSQL.
  • Les services Cloud d’Amazon Web Services.
  • Des langages et logiciels comme Scala, Java, C#.

Par ailleurs, le Data Engineer doit maîtriser le processus ETL (extraction, transformation et chargement), c’est-à-dire la combinaison de données dans un entrepôt de données. Ces dernières peuvent être structurées ou non structurées comme les données :

  • issues des systèmes de paiement en ligne et de gestion de la relation client (CRM) ;
  • provenant des systèmes informatiques des fournisseurs ;
  • produites par les appareils IoT ;
  • liées au marketing et provenant des commentaires des clients ou des réseaux sociaux ;
  • issues de la gestion des ressources humaines.

L’ETL utilise des règles opérationnelles pour le nettoyage et l’organisation de données brutes. Cela les prépare pour le stockage, l’analyse et le machine learning.

L’analytique des données permet de répondre à des besoins particuliers en matière décisionnelle. Il s’agit par exemple de :

  • la prévision du résultat de décisions commerciales ;
  • la restitution de rapports et de tableaux de bord ;
  • la détection d’éventuelles inefficacités opérationnelles ;
  • la gestion des inventaires.

Le Data Scientist

La variété des sujets traités par un Data Scientist nécessite une très bonne capacité d’adaptation. Il est aussi indispensable de faire preuve d’anticipation et d’intuition pour développer ou améliorer un produit. Sa « hauteur de vue » lui permet de distinguer le principal de l’accessoire. Il doit également être un bon communicant, à l’écrit comme à l’oral, dans la mesure où il s’adresse aux décideurs de l’entreprise.

Le Datat Scientist doit aussi maîtriser des compétences techniques telles que :

  • La programmation. Il doit connaître a minima un langage de programmation permettant de traiter les données (R, Python…) et de piloter des bases de données (SQL).
  • Les statistiques, notamment pour définir les techniques d’approche et d’analyse adéquates (SAP, SPSS, SAS).
  • Le Machine Learning. Il s’agit d’une technique de plus en plus utilisée pour la gestion de gros volumes de données ou par les entreprises commercialisant des produits data-driven (Uber, Netflix, Google Maps, etc.). Si le Data Scientist n’est pas un expert en algorithmes, il doit comprendre leur fonctionnement général.
  • L’algèbre linéaire et le calcul multivariable.
  • La préparation des données et la correction des imperfections qui en gênent l’exploitation, par exemple le manque de cohérence dans l’affichage des dates (23-05-28 vs 2023-05-28).
  • La génération de représentations graphiques accessibles par ses interlocuteurs (Data Visualization) et la capacité à communiquer avec ses collaborateurs et sa hiérarchie.
  • Le génie logiciel, notamment s’il est le seul Data Scientist dans l’entreprise.
  • La maîtrise de l’anglais technique.

Les formations pour devenir Data Engineer et Data Scientist

De par leur expertise, les profils de Data Engineer et de Data Scientist sont recherchés par les entreprises. Ils font partie du secteur du digital dont les besoins en formation sont durables. Ainsi, 130 000 personnes par an devraient être formées aux métiers du numérique à l’horizon 2030. À défaut, les besoins de l’économie française ne seront pas pourvus selon l’Institut Montaigne (pdf)*.

Pour exercer ces métiers, une formation solide est indispensable. Ces professionnels sont en général titulaires d’un diplôme de niveau bac + 5. Avec un niveau bac + 2 ou bac + 3, il est également possible d’atteindre ces fonctions avec de l’expérience.

Les employeurs de Data Engineers demandent généralement une formation axée sur l’informatique, l’ingénierie ou les systèmes d’information. 

L’étudiant qui souhaite devenir Data Scientist peut s’orienter vers un master, un diplôme d’ingénieur ou un Msc informatique, Big Data, statistiques, mathématiques ou économétrie.  

Par ailleurs, suivre une formation en alternance est un vrai plus. Chez Webitech, la grande école informatique à Paris, nous proposons un mastère Big Data en alternance. Outre les avantages financiers que procure l’alternance (rémunération, prise en charge des frais de scolarité), vous bénéficiez d’une formation théorique immédiatement mise en œuvre sur le terrain.

Les rémunérations et les perspectives d’évolution

Le salaire d’un Data Engineer en France est compris entre 40 000 € et 52 000 € par an selon Glassdoor. La moyenne du salaire de base est 47 000 € avec une rémunération additionnelle comprise entre 1 500 € et 4 135 €.

L’échelle des salaires pour un Data Scientist est de 42 000 € à 53 000 € par an avec un salaire de base moyen de 51 000 €.

Les rémunérations de ces professionnels sont donc proches avec un rattrapage du salaire du Data Engineer ces dernières années.

Cette évolution traduit l’intérêt croissant des entreprises pour ces professionnels. Malgré la montée en gamme des outils d’automatisation, la préparation et la structuration des données demeurent incontournables. De plus, la mise en place d’infrastructures solides pour gérer les données est valorisée par les employeurs.

S’agissant du métier de Data Scientist, la profession doit actuellement faire face aux avancées de l’intelligence artificielle et du Machine Learning. Ces évolutions technologiques tendent à automatiser de nombreuses tâches autrefois gérées par les Data Scientists. Cela renforce la nécessité d’une collaboration rapprochée avec les Data Engineers.

Data Engineer et Data Scientists sont des métiers nécessitant de nombreuses compétences techniques et personnelles. Chez Webitech, nous avons décidé de mettre l’accent sur le métier de Data Engineer. Ce dernier suscite depuis plusieurs années un intérêt croissant de la part des organisations. Nous proposons également un cursus en alternance pour renforcer l’employabilité de nos étudiants dès l’obtention de leur diplôme.

Source : *selon l’Institut Montaigne