Quand les étudiants de Polytechnique et d’HEC s’immergent dans la Piscine de l’EPITA
Cette année, les écoles Polytechnique et HEC ont lancé un Master of Science (MSc) commun nommé « Big Data for Business ». Réunissant une vingtaine d’étudiants, ce dernier a commencé à la fin de l’été à l’EPITA, à l’occasion d’une Piscine de deux semaines organisée pour permettre à ces futurs experts des données d’appréhender les défis qui les attendent. Olivier Ricou, enseignant-chercheur à l’EPITA et directeur du LRDE, en charge de cette Piscine spéciale (et accessoirement auteur d’un MOOC dédié à Pyhton à destination des scientifiques), et Eric Moulines, enseignant à Polytechnique et responsable pour le côté scientifique de ce nouveau MSc reviennent sur cette initiative inédite.
La Piscine Big Data vue par Olivier Ricou :
« Les écoles Polytechnique et HEC voulaient que les étudiants de ce MSc commencent leur cursus avec un niveau suffisant en programmation afin de pouvoir mettre en application ce qu’ils allaient apprendre par la suite. Pour cela, ils ont voulu leur apprendre le langage Python à travers une Piscine comme sait si bien les organiser l’EPITA. Ils nous ont donc naturellement contactés afin qu’on puisse leur en concocter une destinée à former les étudiants à ce langage et aux outils associés servant à travailler sur le Big Data, tels que la bibliothèque Pandas permettant de faire des manipulations de grosses données et d’en extraire des informations. Le but était vraiment de leur donner les moyens de programmer ce qu’ils verront plus tard en cours, mais aussi de leur expliquer l’environnement présent autour de la programmation. Ils devaient apprendre à gérer la version des programmes réalisés et les faire évoluer dans le temps, à travailler de façon collaborative, à écrire des documentations ainsi que des tests permettant de vérifier qu’on ne casse pas une autre partie du code quand on en écrit de nouvelles lignes, etc. Cette Piscine ne consistait donc pas à simplement taper quelques lignes de code, mais à acquérir les bonnes habitudes pour mettre en œuvre tout ce qu’ils pourront apprendre d’un point de vue théorique durant les deux années du MSc. Mais le Big Data ne repose pas que sur la science. Au-delà de la partie scientifique, il faut se demander quoi faire des données. C’est là où le marketing et HEC entrent en jeu : il faut trouver le bon business model, la bonne solution économique, pour valoriser le travail fait en amont et autour de ces données. C’est ce rôle auquel pourront prétendre ces étudiants. »
La Piscine Big Data vue par Eric Moulines :
« L’idée derrière ce diplôme est de proposer une formation en data science et Big Data permettant à des étudiants de profils ingénieurs et commerce d’acquérir en deux ans une double compétence à la fois technique et marketing/business. Une fois diplômés, ils pourront faire l’interface entre les équipes de data scientists pures et celles davantage axées sur le marketing opérationnel et les problématiques clients. L’autre idée de ce MSc, c’est de concevoir une formation intégrant une pédagogie innovante, sortant des schémas classiques. Faire appel à l’EPITA et à son expérience de la Piscine nous semblait donc particulièrement pertinent, d’autant que les étudiants de ce nouveau cursus avaient des niveaux hétérogènes en informatique. Cette Piscine permettait donc d’amener l’ensemble des étudiants à un niveau raisonnable en un laps de temps relativement court. »