Higher Education and Research in Agronomy

Sensometrics
2012

Packages

Dispositif pédagogique

La spécialisation de statistique appliquée se déroule sur 2 années scolaires.

1ère année de spécialisation

Au premier semestre (semestre 7), l'étudiant doit effectuer un stage de 6 mois ou semestre d'étude à l'étranger.

Au second semestre (semestre 8), 4 modules de statistique sont obligatoires (analyse de données et data mining, statistique et aide à la décision, planification expérimentale, sensométrie). Huit autres modules sont à choisir parmi les modules au choix proposés à Agrocampus. Un module avec un contenu d'informatique est à choisir, les autres sont libres.
L'étudiant peut se focaliser sur un domaine d'application choisi parmi les grands champs disciplinaires couverts par Agrocampus.

2ème année de spécialisation

Le premier semestre de cette dernière année (semestre 9) est plus spécifiques à la statistique et se divise en deux parties.

D'octobre à décembre, les cours et TD constituent environ 20 h par semaine. Le reste du temps est consacré au travail personnel (en particulier à la réalisation de projets) et aux contrôles des connaissances (en particulier aux exposés relatifs aux projets).

En janvier, février les étudiants travaillent sur un projet d'ingénieur. Ce projet est transversal du point de vue des méthodes utilisées. Il consiste à réaliser une étude de cas complète. Il comporte une phase de recherche bibliographique, la mise en ouvre de différentes méthodes, leur comparaison et, le cas échéant, leur adaptation au problème considéré.

Le dernier semestre de la formation (semestre 10) est consituté du stage de fin d'étude.

M1 (bac+4)

S7 (1er semestre)

7 modules au choix

Programme

Sept modules sont à choisir parmi les modules au choix proposés à Agrocampus. L'étudiant peut se focaliser sur un domaine d'application choisi parmi les grands champs disciplinaires couverts par Agrocampus.

Mode d'évaluation

...

1 module d'informatique

Programme

Un module avec un contenu d'informatique est obligatoire.

Analyse des données multidimensionnelles et text mining

Responsable

Intervenants

Objectif

Rendre les étudiants autonomes dans la mise en œuvre des méthodes usuelles d’analyse des données.

Programme

  • Analyse en composantes principales,
  • Analyse factorielle des correspondances,
  • Analyse des correspondances multiples,
  • Classification ascendante hiérarchique,

Les méthodes sont présentées de façon essentiellement géométrique, en limitant les exposés théoriques aux aspects nécessaires à leur utilisation. Une importance particulière est accordée aux problématiques dans lesquelles ces méthodes sont particulièrement précieuses. De nombreuses études de cas illustrent les méthodes.

Prérequis

UC Modèle linéaire et analyse des données

Nombres d'heures

28 heures

Mode d'évaluation

Examen en temps limité (2 heures) ; question théorique + étude de cas.

Bibliographie

Husson F., Lê S. & Pagès J. (2009) Analyse des données avec R. 224 p. Presses Universitaires de Rennes.
Escofier B., Pagès J. (2008) : Analyses Factorielles Simples et Multiples. 4e éd. 318p Dunod.
Lebart L., Morineau A. et Piron M. (2006) Statistique exploratoire multidimensionnelle. 4e éd. 464p Dunod.

Planification expérimentale

Responsable

Intervenants

Objectif

Rendre les étudiants autonomes dans la construction et l'analyse de plans d'expériences classiques.

Programme

Rappels sur le modèle linéaire : Régression simple et multiple, analyse de variance à k facteurs croisés.
Intérêt de la planification expérimentale.
Plans complets : Propriétés, choix d'un modèle.
Plans fractionnaires : Détermination et/ou choix des confusions entre facteurs ; choix d'un plan complémentaire ; dépouillement .
Plans pour facteurs qualitatifs à nombre quelconque de modalités.
Plans pour étudier des surfaces de réponses : plans composites centrés ; plans de Box-Behnken ; analyse d'une surface de réponse.

Prérequis

UC Modèle linéaire et analyse des données

Nombres d'heures

28 heures de cours

Mode d'évaluation

Examen en temps limité (2 heures)

Bibliographie

Pagès J. (2010) Statistiques générales pour utilisateurs. Méthodologie. 2e ed. 264 p. Presses Universitaires de Rennes.
Husson F. & Pagès J. (2005) Statistiques générales pour utilisateurs. Exercices et corrigés. 324 p. Presses Universitaires de Rennes.
Sado G. & Sado M.-C. (1991). Les plans d’expériences. 266 p. Afnor technique.
Benoist D., Tourbier Y. et Germain-Tourbier S. (1994). Plans d’expériences : construction et analyse. 700 p. Tec Doc Lavoisier.
Goupy J. (1998) La méthode des plans d'expériences. Dunod.

Sensométrie

Responsable

Objectif

L'évaluation sensorielle de produits est un élément stratégique du développement des entreprises du secteur agro-alimentaire. Elle vise à caractériser les produits à la fois du point de vue de leurs propriétés organoleptiques et du point de vue des préférences qu'ils suscitent auprès des consommateurs. De ce fait, elle est à la croisée des chemins entre la recherche - développement et le marketing.

Ces évaluations sensorielles nécessitent toujours de volumineux recueils de données. La statistique est l'outil majeur de conception et d'analyse de telles données.

Ce module présente les principales méthodologies statistiques utilisées en analyse sensorielle. Mais la plupart de ces méthodologies s'appliquent, avec bonheur, à bien d'autres domaines.

Programme

  • Bases physiologiques et culturelles de l'analyse sensorielle
  • Planification de séances de dégustation (maîtrise de l'effet du rang, de l'arrière-effet d'un produit, etc) : construction de plan en Blocs Incomplets Equilibrés, de plans optimaux, de plans équilibrés pour les voisinage
  • Performance d'un jury ou d'un juge (répétabilité, reproductibilité, interaction juge-produit, etc.) : analyse de variance à effets aléatoires et mixtes.
  • Construction d'espaces produits - stratégies multidimensionnelles : ACP, positionnement multidimensionnel
  • Relation entre préférences de consommateur, évaluations d'experts, données techniques et physico-chimiques : cartographie des préférences, segmentation des consommateurs

Nombres d'heures

28 heures

Mode d'évaluation

Projet

Statistique et aide à la décision

Responsable

Objectif

Le module a pour but de fournir aux étudiants les éléments leur permettant d'aborder des problèmes de décision en contexte aléatoire. En particulier, il est centré sur la modélisation statistique du risque.

Ce module vise également à lever les blocages méthodologiques ou techniques des étudiants confrontés aux problèmes statistiques de la biologie ou de l'agronomie.

Programme

Afin d'établir un équilibre entre acquisition de connaissances et de savoir-faire, le programme du module donne une égale importance, en termes de volume horaire, aux cours, aux séances de travaux dirigés et aux séances de traitement statistique de données à l'aide de logiciels.

Chaque notion abordée est illustrée par un ou plusieurs exemples dans le domaine de l'agronomie au sens large.

Le programme de ce module comporte 4 blocs de 3 séances dont les contenus sont détaillés dans la suite, séance par séance et de manière chronologique :

  • Analyse de données catégorielles (tests du chi-2)
  • Modèle statistique du risque (modèle logistique)
  • Analyse d'un modèle de risque (analyse de la déviance, sélection de modèle)
  • Décision (discrimination logistique, arbre de décision, ...)

Prérequis

Régression linéaire, Analyse de la variance

Nombres d'heures

28 heures

Mode d'évaluation

...

Bibliographie

An Introduction to Generalised Linear Models par Annette J. Dobson
Modelling Binary Data par D. Collett, David Collett, et Collett Collett

Stage à l'étranger

Programme

Stage de 6 mois à l'étranger.

Mode d'évaluation

...

Stage de fin d'études

Programme

Suivi du stage

Le stage est suivi par le tuteur enseignant, par courrier électronique essentiellement, et par le tuteur de l'entreprise, sur place.

Tutorat universitaire

Tous les enseignants intervenant dans la formation participent à l’encadrement des stagiaires.

Tutorat professionnel

Les entreprises désignent les tuteurs professionnels.

Nombres d'heures

6 mois minimum

Mode d'évaluation

Le stage est évalué par un rapport écrit, et une soutenance orale devant un jury comportant en général trois personnes : le tuteur de l'entreprise, le tuteur enseignant et un autre enseignant.

Analyse de données textuelles

Intervenants

Objectif

Rendre les étudiants autonomes dans l’application des méthodes d’analyse des données aux questions ouvertes dans les enquêtes.

Programme

  • Les textes comme données statistiques
  • Glossaires de mots et segments. Concordances.
  • Codification des textes  
  • Méthodes d’analyse
    • Analyse de correspondances en analyse textuelle
    • Mots et réponses caractéristiques
    • Classification en analyse textuelle
    • Analyse factorielle multiple étendue aux tableaux de contingence
  • Autres types d’application

Les méthodes sont présentées à partir d’une étude de cas. Les  exposés théoriques sont principalement des rappels de méthodes étudiées dans d’autres modules. La problématique des questions ouvertes dans les enquêtes est privilégiée, bien que d’autres applications soient aussi mentionnées.

Prérequis

Module Analyses factorielles

Nombres d'heures

20h

Mode d'évaluation

Etude de cas

Bibliographie

Escofier B., Pagès J. (2008) : Analyses Factorielles Simples et Multiples. 4e éd. 318p Dunod.
Lebart L., Salem  A. (1994) Statistique textuelle. 342p Dunod.
Lebart L., Salem A., Berry L. (1998) Exploring textual data. 264 p Kluwer Academic Publishers

Analyse de la variance

Responsable

Intervenants

Objectif

Connaître les principaux modèles d'analyse de variance.

Programme

  • Analyse de variance à effets fixes
    • Modèle à 1 facteur
    • Modèle à 2 facteurs et plus avec interaction
    • Hypothèses, estimation, table ANOVA
    • Tests de comparaisons multiples, contrastes.
  • Analyse de variance à effets aléatoires
    • Modèle à 1 facteur, 2 facteurs et plus avec interaction
    • Estimation des composantes de la variance
  • Analyse de variance à effets mixtes
    • Modèle à 2 facteurs et plus avec interaction
    • Estimation des composantes de la variance
  • Analyse de variance avec effets hiérarchisés
  • Analyse de la covariance Comparaison de droites de régression

Prérequis

UC Statistique générale - Algèbre linéaire : représentation géométrique dans un espace vectoriel, calcul matriciel, orthogonalité, projection

Nombres d'heures

8h de cours et 16h de travaux dirigés

Mode d'évaluation

...

Bibliographie

  • DAGNÉLIE P. (1998) Statistique théorique et appliquée De Boeck & Larcier.
  • MC CULLAGH P. & NELDER J.A. (1989) Generalized linear models Chapman & Hall
  • Sahai H. & Ageel M.I. (2000) The analysis of variance : Fixed random and Mixed models, Birkhäuser Boston
  • SCHEFFE H. (1959) The analysis of variance Wiley
  • CISIA-CERESTA. (1995) : Aide mémoire pratique des techniques statistique

Analyse discriminante

Responsable

Philippe Michel (Statisticien au ministère de l'Agriculture)

Intervenants

Philippe Michel (Statisticien au ministère de l'Agriculture)

Objectif

Rendre les étudiants autonomes dans la pratique de l’analyse discriminante.

Programme

  • Analyse Factorielle Discriminante Linéaire
  • Compléments
  • Cas particulier de deux groupes
  • Analyse Discriminante « bayésienne »
  • Exemple

Prérequis

Calcul matriciel, Analyse Factorielle

Nombres d'heures

12 heures de cours

Mode d'évaluation

...

Bibliographie

  • Nakache JP & Confais J (2003) Statistique explicative appliquée. 278 p. Editions Technip.
  • Huberty CJ (1994) Applied discriminant analysis. 324 p. J. Wiley.
  • Saporta G (1990) Probabilités Analyse des données et Statistique. 488 p. Editions Technip.

Analyse factorielle

Responsable

Objectif

Rendre les étudiants autonomes dans l’analyse factorielle de tableaux multiples.

Programme

Analyse en composantes principales
Analyse factorielle des correspondances
Analyse des correspondances multiples
Analyse factorielle multiple
Analyse procustéenne
Modèle Indscal
Analyse factorielle multiple hiérarchique

Prérequis

UC Modèle linéaire et analyse des données ; UC Analyse des données multidimensionnelles et text mining

Nombres d'heures

28

Mode d'évaluation

Examen en temps limité (2 heures) ; question théorique + étude de cas.

Bibliographie

Husson F., Lê S. & Pagès J. (2009) Analyse des données avec R. 224 p. Presses Universitaires de Rennes.
Escofier B., Pagès J. (2008). Analyses Factorielles Simples et Multiples. 4e éd. 318p Dunod.

Classification

Responsable

Intervenants

Objectif

Rendre les étudiants autonomes dans la classification automatique.
Programmer une macro SAS permettant de réaliser une classification avec l’algorithme des centres mobiles.

Programme

  • Classification ascendante hiérarchique.
  • Méthodes de partitionnement direct.
  • Modèles de mélange.
  • Classification de variables continues.

Nombres d'heures

15 heures de cours

Mode d'évaluation

Examen écrit et projet

Modélisation non-linéaire et non-paramétrique

Responsable

Objectif

Ce module a pour objectif de prolonger les connaissances et compétences acquises dans les modules de 1ère année en matière de modélisation linéaire, à des situations nécessitant le recours, soit à des méthodes d'estimation plus complexes, soit à des modèles intégrant des effets non-linéaires. A titre illustratif, l'analyse de données à haut-débit telles que celles issues de spectrométrie proche infra-rouge nécessite des méthodes statistiques adaptées à la grande dimension des données (PLS, LASSO, ...) et des modèles statistiques tenant compte du caractère fonctionnel des spectres (Splines, GAM, ...).

L'enseignement donne une place importante à l'analyse effective de données par l'utilisation de différentes librairies de l'environnement libre d'analyse statistique R. Il insiste aussi sur la nécessaire interaction entre le statisticien et son interlocuteur dans la démarche de modélisation.

Programme

 Le module est divisé en quatre blocs :

Prérequis

Modèle linéaire, Modèle linéaire généralisé

Nombres d'heures

38

Mode d'évaluation

...

Méthodes bayésiennes

Responsable

Intervenants

Julie Josse, Jean-Baptiste Denis, Etienne Rivot

Objectif

Initier les étudiants aux méthodes Bayesiennes et aux réseaux Bayesiens

Programme

Statistique Bayésienne :
Historique – Approche Bayesienne / Approche Fréquentiste
Inférence Bayésienne (théorème de Baye, loi a priori, loi a posteriori)
Introduction aux méthodes d’estimation par simulation de Monte-Carlo
Quelques modèles

Réseaux Bayésiens :
Motivation-Exemples
Cadre formel (définition, propriétés)
Construction- unicité - causalité  - variable discrète, continue

L’approche Bayesienne est présentée à travers de nombreux exemples concrets ( halieutique, écologie, médicale, etc.) . L’enseignement  est organisé en cours-TD etTP sur informatique (avec l’utilisation de logiciels spécifiques de calcul Bayésien).

Nombres d'heures

24h

Bibliographie

Robert, C.P.  (2006) : Le choix Bayésien – Principe et pratique. Springer.
Bishop, C.M. (2006) : Pattern recognition and machine learning (chapter 8). Spinger.

Plans d'expériences

Responsable

Intervenants

François Husson, Marc Danzart

Objectif

Construction de plans d'expériences avancés utilisables dans l'industrie agro-alimentaire.

Programme

  • Plans d'expériences en agro-alimentaire
    • Plans en bloc incomplet équilibré
    • Plan D-optimaux
    • Plan de mélange
  • Etude des surfaces de réponses
    • Recherche d'un optimum sur une surface de réponse
    • Recherche d'un optimum dans plusieurs surfaces de réponse

Nombres d'heures

9h de cours

Mode d'évaluation

...

Programmation Python

Responsable

Gabriel Jalam

Intervenants

Gabriel Jalam, Sébastien Lê

Objectif

Réaliser une application en Python qui appelle R en combinant connaissances en Python  et en statistiques (analyse factorielle, modélisation).

Nombres d'heures

15 heures de cours

Mode d'évaluation

Projet

Programmation SAS

Responsable

Intervenants

Objectif

Programmer une macro SAS permettant de réaliser une analyse en composante principale avec l’algorithme NIPALS.

Nombres d'heures

15 heures de cours

Mode d'évaluation

Examen écrit et projet

Sensométrie avancée

Responsable

Intervenants

Objectif

Manipuler des jeux de données complexes; comparer les méthodes de recueil de données sensorielles

 

Programme

Présentation des méthodes holistiques : catégorisation, napping, napping catégorisé.

Comparaison de méthodes d'analyse sensorielle

Données de préférences

Nombres d'heures

12 heures de cours

Mode d'évaluation

Projet

Visual Basic pour Application et RExcel

Responsable

Gabriel Jalam

Intervenants

Gabriel Jalam, Sébastien Lê

Objectif

Réaliser une application dans Excel qui appelle R en combinant connaissances en VBA et en statistiques (analyse factorielle, modélisation, sensométrie).

Programme

  • Langage VBA.
  • Langage VBA développé pour RExcel.

Nombres d'heures

15 heures de cours

Mode d'évaluation

Projet

Projet d'ingénieur

Programme

Le projet d’ingénieur peut-être de deux types :

  • une étude de cas complète, comportant une phase de recherche bibliographique, un recueil de données, la mise en œuvre de différentes méthodes, leur comparaison et l’analyse de leurs apports respectifs quant au problème considéré ;
  • une recherche méthodologique, articulée autour d’une problématique concrète.