Blog Chez Tiime Tiime Inside : Interview de Arthur Lauga, Data ...

Tiime Inside : Interview de Arthur Lauga, Data scientist

Sommaire

    Introduction

    Après Centrale-Supélec, une double spécialité et un master de recherche en physique fondamentale, Arthur a rejoint l’aventure Tiime il y a 3 ans, pour contribuer à un objectif de simplification et d’automatisation progressive de la comptabilité à l’aide d’algorithmes d’intelligence artificielle. 🚀

    Nous lui avons posé quelques questions sur son parcours, son rôle de Sénior Data scientist chez Tiime et les défis d’avenir de l’IA pour que vous puissiez mieux comprendre ce qu’il se passe en coulisse 🧐

    Hello Arthur, peux-tu nous partager ton parcours ? 

    J’ai une double spécialité en optique et photonique et en machine learning. En parallèle de ça, j’ai un master de recherche en physique fondamentale que j’ai fait à l’université de Lorraine quand j’étais à Supélec. Et j'ai rejoint l'aventure Tiime il y a 3 ans et demi, après une césure et un stage de recherche de 6 mois !

    IMG_5479Arthur au Congrès de l'Ordre des Experts-Comptables 2019

    Pour toi, quel est le rôle d’un Data scientist et les compétences nécessaires ?

    Aujourd’hui, “Data scientist” est un peu un mot fourre tout. On emploie souvent ce terme pour parler de ce qu’on appelle un Machine Learning Ingenieur, un Data Ingenieur ou un Data Analyst. 

    Fondamentalement, le métier de Data scientist est celui qui est le plus rapproché à l’Intelligence Artificielle. C’est une personne qui se tient à jour sur la littérature scientifique, le machine learning et qui fait de la recherche à partir de données pour trouver des solutions. Par exemple, chez Tiime, nous recherchons à faire de l’annotation comptable. 

    Un Data scientist, c’est tout le bagage statistique et le bagage mathématique pour comprendre les algorithmes qui sont utilisés. C’est aussi quelqu’un qui a un bagage scientifique qui n’est pas forcément profond dans un domaine particulier mais au contraire assez étendu, pour comprendre la théorie des graphes, un peu de computer science, la théorie de la complexité pour ne pas écrire du code n’importe comment, les bases en statistiques, le modèle de mélange, etc. 

    Pour résumer, un Data scientist, c’est une personne qui a tout un panel de compétences qu’il sait faire interagir pour remettre le problème et les données dans leur contexte et faire des recherches pour trouver des méthodes qui améliorent l’état de l’art. 

    “On fait une hypothèse, on définit une expérience, on fait des mesures puis on la valide ou pas.”

     

    Tout le monde ne peut pas s’improviser Data scientist ?

    Il y a une grosse part d’empirisme, surtout dans le Deep Learning, qui est un peu la méthode en vogue. Avec un esprit critique et de la méthode scientifique, on peut faire des choses, mais on va vite arriver à un point ou assez rapidement, on ne va plus être capable de comprendre les tenants et les aboutissants

    Pour moi, il est vraiment important d’avoir un bon bagage scientifique pour comprendre à la fois les briques théoriques, les briques opérationnelles et tout ce qui en découle.

    Je pense qu’en science, c’est très important d’avoir un mentor. C’est quelqu’un qui va vous apprendre les ficelles du métier, qui va vous emmener dans la bonne direction, vous expliquer les éléments à analyser et à comprendre, les lectures indispensables, etc.

    D’où vient l’intelligence artificielle ?

    Vous avez peut-être l’impression que l’IA est assez récent, mais en réalité, elle prend sa source d’un vieux fantasme qui date peut-être de la protohistoire : l’homme a envie de devenir le créateur d’une chose intelligente. 

    L’IA a trouvé son point culminent en 1956 lors de la conférence de Dartmouth, qui est historiquement l’acte de naissance de l’intelligence artificielle en tant que domaine de recherche acté et reconnu par la communauté scientifique.

    Peux-tu nous expliquer l’approche du Machine Learning en quelques mots ?

    Concrètement, l’algorithme va faire de l’apprentissage par essai-erreur. Il faut imaginer qu’on a des paramètres sur lesquels on peut agir dans le but de donner une réponse pour que lorsqu’on lui montre une image, il puisse faire une prédiction. 

    On va réitérer l’expérience plusieurs fois pour compiler toutes les prédictions du moteur. Une fois qu’on a évalué à quel point il se trompe, on va modifier les paramètres en conséquences pour faire converger le comportement de l’algorithme vers la bonne solution. La méthode mathématique qui est derrière s’appelle la descente du gradient

    Chez Tiime, nous avons plusieurs algorithmes dont 4 principaux qui tournent depuis plus de deux ans et qui ont été construits au fur et à mesure du constat du comportement des algorithmes précédents. Chaque algorithme a un nom et une spécificité

    Bien évidemment, il y a une dépendance très forte entre l’expertise technique (data scientist) et l’expertise métier que les experts-comptables nous ont transmis pour que l’on soit capable de formuler le problème au plus proche de ce qu’un expert-comptable fait réellement dans son travail au jour le jour.

    Quels sont pour toi les défis d’avenir de l’IA ?

    Il y a des progrès assez marqués dans le domaine de la médecine et donc beaucoup d’espoir fondés dans les techniques d’IA pour améliorer l’existant. On constate aussi des progrès certains sur la voiture autonome et encore et toujours sur les algorithmes de recommandations. 

    Mais chaque technique vient avec son lot de révolutions et de limites. Dès qu’on parle d’un métier qui est difficile pour la compréhension d’un ordinateur, la communication par exemple et tout ce qui relève d’une compréhension innée de ce phénomène social - là où les humains sont naturellement très forts - on rencontre des limites. On peut apporter du progrès mais on ne peut pas remplacer l’humain

     

    1583830635019

    On entend beaucoup parler de l’explicabilité des process, est-ce qu’il y a des travaux qui sont fait là-dessus ?

    Effectivement, c’est un sujet qui revient assez souvent. On a un algorithme de Deep Learning aujourd’hui qui n’a pas la capacité d’expliquer pourquoi il fait ces choix, là où un humain a tendance à vouloir avoir une perception causale de ce qui se passe autour de lui. 

    Aujourd’hui, si on n’a pas une interprétation causale de quelque chose, on ne peut pas définir une notion de responsabilité. L’IA va donc être un outil utilisé par des experts, quel que soit le domaine, pour venir en aide et en support à l’expertise humaine. 

    Par exemple, pour ce qui est de faire des prédictions sur la comptabilité, nos algorithmes ont de bonnes performances, ça aide beaucoup les comptables, mais on ne les remplace pas !