Dispositif pédagogique
La spécialisation de statistique appliquée se déroule sur 2 années scolaires.
1ère année de spécialisation
Au premier semestre (semestre 7), l'étudiant doit effectuer un stage de 6 mois ou semestre d'étude à l'étranger.
Au second semestre (semestre 8), 4 modules de statistique sont obligatoires (analyse de données et data mining, statistique et aide à la décision, planification expérimentale, sensométrie). Huit autres modules sont à choisir parmi les modules au choix proposés à Agrocampus. Un module avec un contenu d'informatique est à choisir, les autres sont libres.
L'étudiant peut se focaliser sur un domaine d'application choisi parmi les grands champs disciplinaires couverts par Agrocampus.
2ème année de spécialisation
Le premier semestre de cette dernière année (semestre 9) est plus spécifiques à la statistique et se divise en deux parties.
D'octobre à décembre, les cours et TD constituent environ 20 h par semaine. Le reste du temps est consacré au travail personnel (en particulier à la réalisation de projets) et aux contrôles des connaissances (en particulier aux exposés relatifs aux projets).
En janvier, février les étudiants travaillent sur un projet d'ingénieur. Ce projet est transversal du point de vue des méthodes utilisées. Il consiste à réaliser une étude de cas complète. Il comporte une phase de recherche bibliographique, la mise en ouvre de différentes méthodes, leur comparaison et, le cas échéant, leur adaptation au problème considéré.
Le dernier semestre de la formation (semestre 10) est consituté du stage de fin d'étude.
M1 (bac+4)
S8 (2ème semestre)
Langues
- Allemand / Espagnol / Italien
- Anglais
Modules au choix
S7 (1er semestre)
Stage
M2 (bac+5)
S10 (2ème semestre)
Stage
S9 (1er semestre)
Langues
- Allemand / Espagnol / Italien
- Anglais
Modules obligatoires
- Analyse de données textuelles
- Analyse de la variance
- Analyse discriminante
- Analyse factorielle
- Chimiométrie
- Classification
- Modélisation non-linéaire et non-paramétrique
- Méthodes bayésiennes
- Plans d'expériences
- Programmation Python
- Programmation SAS
- Sensométrie avancée
- Visual Basic pour Application et RExcel
Projet ingénieur
7 modules au choix
Programme
Sept modules sont à choisir parmi les modules au choix proposés à Agrocampus. L'étudiant peut se focaliser sur un domaine d'application choisi parmi les grands champs disciplinaires couverts par Agrocampus.
Mode d'évaluation
...
1 module d'informatique
Programme
Un module avec un contenu d'informatique est obligatoire.
Analyse des données multidimensionnelles et text mining
Responsable
Intervenants
Objectif
Rendre les étudiants autonomes dans la mise en œuvre des méthodes usuelles d’analyse des données.
Programme
- Analyse en composantes principales,
- Analyse factorielle des correspondances,
- Analyse des correspondances multiples,
- Classification ascendante hiérarchique,
Les méthodes sont présentées de façon essentiellement géométrique, en limitant les exposés théoriques aux aspects nécessaires à leur utilisation. Une importance particulière est accordée aux problématiques dans lesquelles ces méthodes sont particulièrement précieuses. De nombreuses études de cas illustrent les méthodes.
Prérequis
UC Modèle linéaire et analyse des données
Nombres d'heures
28 heures
Mode d'évaluation
Examen en temps limité (2 heures) ; question théorique + étude de cas.
Bibliographie
Husson F., Lê S. & Pagès J. (2009) Analyse des données avec R. 224 p. Presses Universitaires de Rennes.
Escofier B., Pagès J. (2008) : Analyses Factorielles Simples et Multiples. 4e éd. 318p Dunod.
Lebart L., Morineau A. et Piron M. (2006) Statistique exploratoire multidimensionnelle. 4e éd. 464p Dunod.
Planification expérimentale
Responsable
Intervenants
Objectif
Rendre les étudiants autonomes dans la construction et l'analyse de plans d'expériences classiques.
Programme
Rappels sur le modèle linéaire : Régression simple et multiple, analyse de variance à k facteurs croisés.
Intérêt de la planification expérimentale.
Plans complets : Propriétés, choix d'un modèle.
Plans fractionnaires : Détermination et/ou choix des confusions entre facteurs ; choix d'un plan complémentaire ; dépouillement .
Plans pour facteurs qualitatifs à nombre quelconque de modalités.
Plans pour étudier des surfaces de réponses : plans composites centrés ; plans de Box-Behnken ; analyse d'une surface de réponse.
Prérequis
UC Modèle linéaire et analyse des données
Nombres d'heures
28 heures de cours
Mode d'évaluation
Examen en temps limité (2 heures)
Bibliographie
Pagès J. (2010) Statistiques générales pour utilisateurs. Méthodologie. 2e ed. 264 p. Presses Universitaires de Rennes.
Husson F. & Pagès J. (2005) Statistiques générales pour utilisateurs. Exercices et corrigés. 324 p. Presses Universitaires de Rennes.
Sado G. & Sado M.-C. (1991). Les plans d’expériences. 266 p. Afnor technique.
Benoist D., Tourbier Y. et Germain-Tourbier S. (1994). Plans d’expériences : construction et analyse. 700 p. Tec Doc Lavoisier.
Goupy J. (1998) La méthode des plans d'expériences. Dunod.
Sensométrie
Responsable
Objectif
L'évaluation sensorielle de produits est un élément stratégique du développement des entreprises du secteur agro-alimentaire. Elle vise à caractériser les produits à la fois du point de vue de leurs propriétés organoleptiques et du point de vue des préférences qu'ils suscitent auprès des consommateurs. De ce fait, elle est à la croisée des chemins entre la recherche - développement et le marketing.
Ces évaluations sensorielles nécessitent toujours de volumineux recueils de données. La statistique est l'outil majeur de conception et d'analyse de telles données.
Ce module présente les principales méthodologies statistiques utilisées en analyse sensorielle. Mais la plupart de ces méthodologies s'appliquent, avec bonheur, à bien d'autres domaines.
Programme
- Bases physiologiques et culturelles de l'analyse sensorielle
- Planification de séances de dégustation (maîtrise de l'effet du rang, de l'arrière-effet d'un produit, etc) : construction de plan en Blocs Incomplets Equilibrés, de plans optimaux, de plans équilibrés pour les voisinage
- Performance d'un jury ou d'un juge (répétabilité, reproductibilité, interaction juge-produit, etc.) : analyse de variance à effets aléatoires et mixtes.
- Construction d'espaces produits - stratégies multidimensionnelles : ACP, positionnement multidimensionnel
- Relation entre préférences de consommateur, évaluations d'experts, données techniques et physico-chimiques : cartographie des préférences, segmentation des consommateurs
Nombres d'heures
28 heures
Mode d'évaluation
Projet
Statistique et aide à la décision
Responsable
Objectif
Le module a pour but de fournir aux étudiants les éléments leur permettant d'aborder des problèmes de décision en contexte aléatoire. En particulier, il est centré sur la modélisation statistique du risque.
Ce module vise également à lever les blocages méthodologiques ou techniques des étudiants confrontés aux problèmes statistiques de la biologie ou de l'agronomie.
Programme
Afin d'établir un équilibre entre acquisition de connaissances et de savoir-faire, le programme du module donne une égale importance, en termes de volume horaire, aux cours, aux séances de travaux dirigés et aux séances de traitement statistique de données à l'aide de logiciels.
Chaque notion abordée est illustrée par un ou plusieurs exemples dans le domaine de l'agronomie au sens large.
Le programme de ce module comporte 4 blocs de 3 séances dont les contenus sont détaillés dans la suite, séance par séance et de manière chronologique :
- Analyse de données catégorielles (tests du chi-2)
- Modèle statistique du risque (modèle logistique)
- Analyse d'un modèle de risque (analyse de la déviance, sélection de modèle)
- Décision (discrimination logistique, arbre de décision, ...)
Prérequis
Régression linéaire, Analyse de la variance
Nombres d'heures
28 heures
Mode d'évaluation
...
Bibliographie
An Introduction to Generalised Linear Models par Annette J. Dobson
Modelling Binary Data par D. Collett, David Collett, et Collett Collett
Stage à l'étranger
Programme
Stage de 6 mois à l'étranger.
Mode d'évaluation
...
Stage de fin d'études
Programme
Suivi du stage
Le stage est suivi par le tuteur enseignant, par courrier électronique essentiellement, et par le tuteur de l'entreprise, sur place.
Tutorat universitaire
Tous les enseignants intervenant dans la formation participent à l’encadrement des stagiaires.
Tutorat professionnel
Les entreprises désignent les tuteurs professionnels.
Nombres d'heures
6 mois minimum
Mode d'évaluation
Le stage est évalué par un rapport écrit, et une soutenance orale devant un jury comportant en général trois personnes : le tuteur de l'entreprise, le tuteur enseignant et un autre enseignant.
Analyse de données textuelles
Responsable
Intervenants
Objectif
Rendre les étudiants autonomes dans l’application des méthodes d’analyse des données aux questions ouvertes dans les enquêtes.
Programme
- Les textes comme données statistiques
- Glossaires de mots et segments. Concordances.
- Codification des textes
- Méthodes d’analyse
- Analyse de correspondances en analyse textuelle
- Mots et réponses caractéristiques
- Classification en analyse textuelle
- Analyse factorielle multiple étendue aux tableaux de contingence
- Autres types d’application
Les méthodes sont présentées à partir d’une étude de cas. Les exposés théoriques sont principalement des rappels de méthodes étudiées dans d’autres modules. La problématique des questions ouvertes dans les enquêtes est privilégiée, bien que d’autres applications soient aussi mentionnées.
Prérequis
Module Analyses factorielles
Nombres d'heures
20h
Mode d'évaluation
Etude de cas
Bibliographie
Escofier B., Pagès J. (2008) : Analyses Factorielles Simples et Multiples. 4e éd. 318p Dunod.
Lebart L., Salem A. (1994) Statistique textuelle. 342p Dunod.
Lebart L., Salem A., Berry L. (1998) Exploring textual data. 264 p Kluwer Academic Publishers
Analyse de la variance
Responsable
Intervenants
Objectif
Connaître les principaux modèles d'analyse de variance.
Programme
- Analyse de variance à effets fixes
- Modèle à 1 facteur
- Modèle à 2 facteurs et plus avec interaction
- Hypothèses, estimation, table ANOVA
- Tests de comparaisons multiples, contrastes.
- Analyse de variance à effets aléatoires
- Modèle à 1 facteur, 2 facteurs et plus avec interaction
- Estimation des composantes de la variance
- Analyse de variance à effets mixtes
- Modèle à 2 facteurs et plus avec interaction
- Estimation des composantes de la variance
- Analyse de variance avec effets hiérarchisés
- Analyse de la covariance Comparaison de droites de régression
Prérequis
UC Statistique générale - Algèbre linéaire : représentation géométrique dans un espace vectoriel, calcul matriciel, orthogonalité, projection
Nombres d'heures
8h de cours et 16h de travaux dirigés
Mode d'évaluation
...
Bibliographie
- DAGNÉLIE P. (1998) Statistique théorique et appliquée De Boeck & Larcier.
- MC CULLAGH P. & NELDER J.A. (1989) Generalized linear models Chapman & Hall
- Sahai H. & Ageel M.I. (2000) The analysis of variance : Fixed random and Mixed models, Birkhäuser Boston
- SCHEFFE H. (1959) The analysis of variance Wiley
- CISIA-CERESTA. (1995) : Aide mémoire pratique des techniques statistique
Analyse discriminante
Responsable
Philippe Michel (Statisticien au ministère de l'Agriculture)
Intervenants
Philippe Michel (Statisticien au ministère de l'Agriculture)
Objectif
Rendre les étudiants autonomes dans la pratique de l’analyse discriminante.
Programme
- Analyse Factorielle Discriminante Linéaire
- Compléments
- Cas particulier de deux groupes
- Analyse Discriminante « bayésienne »
- Exemple
Prérequis
Calcul matriciel, Analyse Factorielle
Nombres d'heures
12 heures de cours
Mode d'évaluation
...
Bibliographie
- Nakache JP & Confais J (2003) Statistique explicative appliquée. 278 p. Editions Technip.
- Huberty CJ (1994) Applied discriminant analysis. 324 p. J. Wiley.
- Saporta G (1990) Probabilités Analyse des données et Statistique. 488 p. Editions Technip.
Analyse factorielle
Responsable
Intervenants
Objectif
Rendre les étudiants autonomes dans l’analyse factorielle de tableaux multiples.
Programme
Analyse en composantes principales
Analyse factorielle des correspondances
Analyse des correspondances multiples
Analyse factorielle multiple
Analyse procustéenne
Modèle Indscal
Analyse factorielle multiple hiérarchique
Prérequis
UC Modèle linéaire et analyse des données ; UC Analyse des données multidimensionnelles et text mining
Nombres d'heures
28
Mode d'évaluation
Examen en temps limité (2 heures) ; question théorique + étude de cas.
Bibliographie
Husson F., Lê S. & Pagès J. (2009) Analyse des données avec R. 224 p. Presses Universitaires de Rennes.
Escofier B., Pagès J. (2008). Analyses Factorielles Simples et Multiples. 4e éd. 318p Dunod.
Classification
Responsable
Intervenants
Objectif
Rendre les étudiants autonomes dans la classification automatique.
Programmer une macro SAS permettant de réaliser une classification avec l’algorithme des centres mobiles.
Programme
- Classification ascendante hiérarchique.
- Méthodes de partitionnement direct.
- Modèles de mélange.
- Classification de variables continues.
Nombres d'heures
15 heures de cours
Mode d'évaluation
Examen écrit et projet
Modélisation non-linéaire et non-paramétrique
Responsable
Objectif
Ce module a pour objectif de prolonger les connaissances et compétences acquises dans les modules de 1ère année en matière de modélisation linéaire, à des situations nécessitant le recours, soit à des méthodes d'estimation plus complexes, soit à des modèles intégrant des effets non-linéaires. A titre illustratif, l'analyse de données à haut-débit telles que celles issues de spectrométrie proche infra-rouge nécessite des méthodes statistiques adaptées à la grande dimension des données (PLS, LASSO, ...) et des modèles statistiques tenant compte du caractère fonctionnel des spectres (Splines, GAM, ...).
L'enseignement donne une place importante à l'analyse effective de données par l'utilisation de différentes librairies de l'environnement libre d'analyse statistique R. Il insiste aussi sur la nécessaire interaction entre le statisticien et son interlocuteur dans la démarche de modélisation.
Programme
Le module est divisé en quatre blocs :
- Modèle linéaire en grande dimension : sélection de modèles, PLS, régularisation
- Modélisation non-linéaire : approche systémique, modèle d'une dynamique par un système d'équations différentielles
- Modélisation de données fonctionnelles : modèles GAM, Splines
- Modèle pour données catégorielles : extension des modèles vus précédemment au périmètre du GLM
Prérequis
Modèle linéaire, Modèle linéaire généralisé
Nombres d'heures
38
Mode d'évaluation
...
Méthodes bayésiennes
Responsable
Intervenants
Julie Josse, Jean-Baptiste Denis, Etienne Rivot
Objectif
Initier les étudiants aux méthodes Bayesiennes et aux réseaux Bayesiens
Programme
Statistique Bayésienne :
Historique – Approche Bayesienne / Approche Fréquentiste
Inférence Bayésienne (théorème de Baye, loi a priori, loi a posteriori)
Introduction aux méthodes d’estimation par simulation de Monte-Carlo
Quelques modèles
Réseaux Bayésiens :
Motivation-Exemples
Cadre formel (définition, propriétés)
Construction- unicité - causalité - variable discrète, continue
L’approche Bayesienne est présentée à travers de nombreux exemples concrets ( halieutique, écologie, médicale, etc.) . L’enseignement est organisé en cours-TD etTP sur informatique (avec l’utilisation de logiciels spécifiques de calcul Bayésien).
Nombres d'heures
24h
Bibliographie
Robert, C.P. (2006) : Le choix Bayésien – Principe et pratique. Springer.
Bishop, C.M. (2006) : Pattern recognition and machine learning (chapter 8). Spinger.
Plans d'expériences
Responsable
Intervenants
François Husson, Marc Danzart
Objectif
Construction de plans d'expériences avancés utilisables dans l'industrie agro-alimentaire.
Programme
- Plans d'expériences en agro-alimentaire
- Plans en bloc incomplet équilibré
- Plan D-optimaux
- Plan de mélange
- Etude des surfaces de réponses
- Recherche d'un optimum sur une surface de réponse
- Recherche d'un optimum dans plusieurs surfaces de réponse
Nombres d'heures
9h de cours
Mode d'évaluation
...
Programmation Python
Responsable
Gabriel Jalam
Intervenants
Gabriel Jalam, Sébastien Lê
Objectif
Réaliser une application en Python qui appelle R en combinant connaissances en Python et en statistiques (analyse factorielle, modélisation).
Nombres d'heures
15 heures de cours
Mode d'évaluation
Projet
Programmation SAS
Responsable
Intervenants
Objectif
Programmer une macro SAS permettant de réaliser une analyse en composante principale avec l’algorithme NIPALS.
Nombres d'heures
15 heures de cours
Mode d'évaluation
Examen écrit et projet
Sensométrie avancée
Responsable
Intervenants
Objectif
Manipuler des jeux de données complexes; comparer les méthodes de recueil de données sensorielles
Programme
Présentation des méthodes holistiques : catégorisation, napping, napping catégorisé.
Comparaison de méthodes d'analyse sensorielle
Données de préférences
Nombres d'heures
12 heures de cours
Mode d'évaluation
Projet
Visual Basic pour Application et RExcel
Responsable
Gabriel Jalam
Intervenants
Gabriel Jalam, Sébastien Lê
Objectif
Réaliser une application dans Excel qui appelle R en combinant connaissances en VBA et en statistiques (analyse factorielle, modélisation, sensométrie).
Programme
- Langage VBA.
- Langage VBA développé pour RExcel.
Nombres d'heures
15 heures de cours
Mode d'évaluation
Projet
Projet d'ingénieur
Programme
Le projet d’ingénieur peut-être de deux types :
- une étude de cas complète, comportant une phase de recherche bibliographique, un recueil de données, la mise en œuvre de différentes méthodes, leur comparaison et l’analyse de leurs apports respectifs quant au problème considéré ;
- une recherche méthodologique, articulée autour d’une problématique concrète.


