Dispositif pédagogique
La première année de cette spécialité du Master est dédiée à un enseignement dont l'objectif est d'acquérir des compétences en statistique et des compétences générales dans les principaux domaines des sciences agronomiques et agro-alimentaires.
La deuxième année comporte 11 semaines de cours plus spécialisés (approfondissement des différentes méthodes statistiques). Les 9 semaines suivantes sont consacrées à la réalisation d'un projet professionnalisant. Et enfin les six derniers mois sont dédiés au stage de fin d'étude.
L'étudiant adapte de plus son cursus à son projet de formation par son choix :
- de modules dans le domaine de l'environnement, des productions végétales ou animales, de l'agro-alimentaire, de la génétique,
- des projets réalisés en cours de formation,
- de son mémoire de fin d'études.
M1 (bac+4)
S8 (2ème semestre)
Autres
- Etude de cas
Modules obligatoires
Modules optionnels 1
Modules optionnels 2
Modules optionnels 3
S7 (1er semestre)
Modules obligatoires
- Algorithmique et programmation
- Introduction à la zootechnie
- Langage Java
- Logiciels statistiques
- Modèle linéaire et analyse des données
- Science du sol
- Statistique générale
- Système de gestion de bases de données
- Systèmes d'informations géographiques
- Technologie générale
Autres
- Anglais
M2 (bac+5)
S10 (2ème semestre)
Stage
S9 (1er semestre)
Autres
- Anglais
Modules obligatoires
- Analyse de données textuelles
- Analyse de la variance
- Analyse discriminante
- Analyse factorielle
- Chimiométrie
- Classification
- Modélisation non-linéaire et non-paramétrique
- Méthodes bayésiennes
- Plans d'expériences
- Programmation Python
- Programmation SAS
- Sensométrie avancée
- Visual Basic pour Application et RExcel
Projet ingénieur
Analyse des données multidimensionnelles et text mining
Responsable
Intervenants
Objectif
Rendre les étudiants autonomes dans la mise en œuvre des méthodes usuelles d’analyse des données.
Programme
- Analyse en composantes principales,
- Analyse factorielle des correspondances,
- Analyse des correspondances multiples,
- Classification ascendante hiérarchique,
Les méthodes sont présentées de façon essentiellement géométrique, en limitant les exposés théoriques aux aspects nécessaires à leur utilisation. Une importance particulière est accordée aux problématiques dans lesquelles ces méthodes sont particulièrement précieuses. De nombreuses études de cas illustrent les méthodes.
Prérequis
UC Modèle linéaire et analyse des données
Nombres d'heures
28 heures
Mode d'évaluation
Examen en temps limité (2 heures) ; question théorique + étude de cas.
Bibliographie
Husson F., Lê S. & Pagès J. (2009) Analyse des données avec R. 224 p. Presses Universitaires de Rennes.
Escofier B., Pagès J. (2008) : Analyses Factorielles Simples et Multiples. 4e éd. 318p Dunod.
Lebart L., Morineau A. et Piron M. (2006) Statistique exploratoire multidimensionnelle. 4e éd. 464p Dunod.
Analyse statistique de données biologiques de type Xomique
Responsable
Intervenants
Sébastien Lê, Maela Kloareg
Objectif
La génétique moléculaire connaît une révolution méthodologique sans précédent permettant de quantifier simultanément l’expression non plus d’un seul gène mais de milliers de gènes. Ces nouvelles approches dites de transcriptomique, de protéomique ou encore de métabolomique, qui se développent de plus en plus, demandent aux biologistes moléculaires de s’ouvrir aux statistiques.
Ce module constitue un élément essentiel pour atteindre une double compétence “ biologiste/statisticien ” particulièrement appréciée dans les laboratoires de recherche mettant en œuvre ces approches. Il a pour objectif de vous rendre autonomes (maîtrise des concepts et savoir-faire, développement de l’esprit critique) face aux questionnements biologiques les plus fréquents issus de ces approches à haut débit ou issus d’approches plus classiques (qui peut le plus peut le moins).
Programme
- Introduction
- Méthodes de génération des données à haut débit
- Plans d’expérience et normalisation des données
- Introduction au langage “ R ” de programmation
- Questions biologiques et Analyses statistiques pour y répondre
- Quels sont les gènes différentiellement “ exprimés ” entre conditions analysées ?
- Y-a-t-il des groupes de gènes ayant des comportements similaires ET/OU des groupes d’échantillons de profils géniques similaires ?
- Y-a-t-il des liens entre les niveaux d’expressions géniques et les niveaux d’autres variables par exemple de type métaboliques ?
Nombres d'heures
25 heures de cours/TD
Mode d'évaluation
Examen écrit
Planification expérimentale
Responsable
Intervenants
Objectif
Rendre les étudiants autonomes dans la construction et l'analyse de plans d'expériences classiques.
Programme
Rappels sur le modèle linéaire : Régression simple et multiple, analyse de variance à k facteurs croisés.
Intérêt de la planification expérimentale.
Plans complets : Propriétés, choix d'un modèle.
Plans fractionnaires : Détermination et/ou choix des confusions entre facteurs ; choix d'un plan complémentaire ; dépouillement .
Plans pour facteurs qualitatifs à nombre quelconque de modalités.
Plans pour étudier des surfaces de réponses : plans composites centrés ; plans de Box-Behnken ; analyse d'une surface de réponse.
Prérequis
UC Modèle linéaire et analyse des données
Nombres d'heures
28 heures de cours
Mode d'évaluation
Examen en temps limité (2 heures)
Bibliographie
Pagès J. (2010) Statistiques générales pour utilisateurs. Méthodologie. 2e ed. 264 p. Presses Universitaires de Rennes.
Husson F. & Pagès J. (2005) Statistiques générales pour utilisateurs. Exercices et corrigés. 324 p. Presses Universitaires de Rennes.
Sado G. & Sado M.-C. (1991). Les plans d’expériences. 266 p. Afnor technique.
Benoist D., Tourbier Y. et Germain-Tourbier S. (1994). Plans d’expériences : construction et analyse. 700 p. Tec Doc Lavoisier.
Goupy J. (1998) La méthode des plans d'expériences. Dunod.
Sensométrie
Responsable
Objectif
L'évaluation sensorielle de produits est un élément stratégique du développement des entreprises du secteur agro-alimentaire. Elle vise à caractériser les produits à la fois du point de vue de leurs propriétés organoleptiques et du point de vue des préférences qu'ils suscitent auprès des consommateurs. De ce fait, elle est à la croisée des chemins entre la recherche - développement et le marketing.
Ces évaluations sensorielles nécessitent toujours de volumineux recueils de données. La statistique est l'outil majeur de conception et d'analyse de telles données.
Ce module présente les principales méthodologies statistiques utilisées en analyse sensorielle. Mais la plupart de ces méthodologies s'appliquent, avec bonheur, à bien d'autres domaines.
Programme
- Bases physiologiques et culturelles de l'analyse sensorielle
- Planification de séances de dégustation (maîtrise de l'effet du rang, de l'arrière-effet d'un produit, etc) : construction de plan en Blocs Incomplets Equilibrés, de plans optimaux, de plans équilibrés pour les voisinage
- Performance d'un jury ou d'un juge (répétabilité, reproductibilité, interaction juge-produit, etc.) : analyse de variance à effets aléatoires et mixtes.
- Construction d'espaces produits - stratégies multidimensionnelles : ACP, positionnement multidimensionnel
- Relation entre préférences de consommateur, évaluations d'experts, données techniques et physico-chimiques : cartographie des préférences, segmentation des consommateurs
Nombres d'heures
28 heures
Mode d'évaluation
Projet
Statistique et aide à la décision
Responsable
Objectif
Le module a pour but de fournir aux étudiants les éléments leur permettant d'aborder des problèmes de décision en contexte aléatoire. En particulier, il est centré sur la modélisation statistique du risque.
Ce module vise également à lever les blocages méthodologiques ou techniques des étudiants confrontés aux problèmes statistiques de la biologie ou de l'agronomie.
Programme
Afin d'établir un équilibre entre acquisition de connaissances et de savoir-faire, le programme du module donne une égale importance, en termes de volume horaire, aux cours, aux séances de travaux dirigés et aux séances de traitement statistique de données à l'aide de logiciels.
Chaque notion abordée est illustrée par un ou plusieurs exemples dans le domaine de l'agronomie au sens large.
Le programme de ce module comporte 4 blocs de 3 séances dont les contenus sont détaillés dans la suite, séance par séance et de manière chronologique :
- Analyse de données catégorielles (tests du chi-2)
- Modèle statistique du risque (modèle logistique)
- Analyse d'un modèle de risque (analyse de la déviance, sélection de modèle)
- Décision (discrimination logistique, arbre de décision, ...)
Prérequis
Régression linéaire, Analyse de la variance
Nombres d'heures
28 heures
Mode d'évaluation
Examen écrit en temps limité.
Bibliographie
An Introduction to Generalised Linear Models par Annette J. Dobson
Modelling Binary Data par D. Collett, David Collett, et Collett Collett
Langage C
Responsable
Objectif
Ce module de "Langage C" vise à présenter le langage de programmation C, à pratiquer l'algorithmique (procédurale) et à initier les étudiants au calcul scientifique (c'est à dire à l'utilisation de l'ordinateur pour des applications scientifiques) et à l'interfaçage R.
Programme
Ce cours est composé de trois parties distinctes. Une partie théorique de rappels d'algorithmique procédurale, de rappel sur le fonctionnement des ordinateurs et de présentation des spécificités du langage C (en particulier la manipulation de pointeurs). Une large partie amenant à découvrir le langage C au moyen de TP (lectures de fichiers, manipulation des tableaux, ...). Une troisième partie est consacrée à une réalisation pratique sous la forme d'un mini-projet.
En fonction du niveau du groupe, deux séances peuvent être consacrés à l'apprentissage de l'utilisation de ce langage pour développer des fonctions efficaces pour R.
Prérequis
Quelques notions algorithmiques sont les bienvenues, mais pas indispensables.
Mode d'évaluation
Examen écrit et projet
Risques agro-environnementaux et sanitaires
Responsable
Christophe Cudennec
Intervenants
Christophe Cudennec, Pierre Aurousseau, Caroline Lelaidier, V. Van Tilbeurgh
Objectif
Ce module vise à donner les bases de l’évaluation et de la gestion des risques, et d’envisager la diversité des enjeux et des méthodes, en illustrant avec différents exemples agronomiques, environnementaux et sanitaires.
Programme
- Concepts et définitions génériques des risques et des crises
- Risques naturels événementiels, analyse fréquentielle, prévention et protection par l’aménagement du territoire (aléa/vulnérabilité)
- Risques agro-environnementaux diffus et multifactoriels, méthodes combinatoires et hiérarchiques
- Risques sanitaires chroniques, méthodes épidémiologiques et écotoxicologiques (danger/exposition)
- Risques et crises alimentaires récentes, aspects vétérinaires et organisationnels
- Analyse d’accident par retour d’expérience et arbre des causes ; Prévention a priori par la méthode HACCP
- Incertitudes, innovation, risques émergents, prospective, expertise
- Sociologie du risque, perception et acceptabilité sociales
Mode d'évaluation
Examen écrit de 2 heures sans documents, présentation du projet
Bioinformatique
Responsable
Frédéric Lecerf
Objectif
Devant l’accumulation des données de biologie moléculaire (génome, transcriptome et protéome), l’usage de l’informatique, et plus particulièrement la bioinformatique, est devenu un élément central dans l’exploitation de résultats expérimentaux en biologie moléculaire et il importe que les ingénieurs :
- comprennent les méthodes mises en œuvre dans les logiciels utilisés dans les laboratoires pour en tirer le meilleur parti
- soient capables d’utiliser efficacement les différentes données et les différents outils disponibles pour répondre à leurs problématiques
Ce module est principalement centré sur les méthodes informatiques mises en œuvre pour aligner des séquences. Les alignements ont des applications nombreuses et les différentes méthodes abordées seront utilisées pour traiter des questions fréquentes en biologie. L'environnement bioinformatique (banque de données) sera aussi évoqué, ainsi que des approches plus spécifiques (méthode de prédiction de gènes, analyse de promoteurs, etc.).
Programme
- Qu’est-ce qu’un alignement de séquences ?
- Méthodes d’alignement de séquences
- Présentation des banques et des différents BLAST
- Alignements multiples
- Présentation de sites web
- Prédiction de gènes
- GO ! Gene Ontology
- Recherche et découverte de motifs
Imagerie numérique
Responsable
Intervenants
Louis Bonneau de Beaufort, Hervé Nicolas
Objectif
Appropriation de l'objet « image » et des opérations permettant d'en extraire des informations pertinentes.
Programme
Introduction aux images numériques, rappels d'optique et de géométrie, notion de signal, de voisinage et de connexité.
Couleurs, codage et stockage des images numériques, traitement du signal.
Opérations élémentaire, filtres, morphologie mathématique.
Détection de contours, classification et segmentation d'images.
Présentations d'applications agro-alimentaires, médicales, ou d'aménagement du territoire
Prérequis
Curiosité intellectuelle.
Mode d'évaluation
Examen écrit
Management de projet
Objectif
Le projet, ensemble de tâches cohérentes, liées, limitées dans le temps, le coût et l’espace, est un concept qui se développe de plus en plus dans le management des entreprises agro-alimentaires. L’objectif du module est de sensibiliser les étudiants à ce concept par une approche théorique s’appuyant sur des études de cas.
Programme
Le management des projets : vue d’ensemble, cycle de vie d’un projet, organisation, acteurs.
Elaboration du plan d’action : préparation, construction, estimation et risque, finalisation.
Conduite des projets : organisation du contrôle, pilotage des réalisations, le « métier » de chef de projet.
Synthèse – référentiel
Mode d'évaluation
Examen écrit
Méthodes de développement d'applications informatiques
Responsable
Christine Largouët
Objectif
Comprendre les concepts objets et être capable de spécifier une nouvelle application informatique à l'aide d'UML (Unified Modeling Language). Tout au long du module, l'accent est mis sur la capacité à raisonner selon la notion d'objet afin de proposer l'analyse la plus juste possible pour répondre à un besoin spécifique en informatique. L'ingénieur agronome ayant ici un rôle de médiateur entre les acteurs du domaine et les informaticiens.
Programme
Présentation des concepts objets (objet, classe, généralisation-spécialisation, héritage, polymorphisme). Les différents diagrammes constituants le langage UML sont présentés et mis en pratique dans de nombreux TD.
Mode d'évaluation
Projet
Algorithmique et programmation
Responsable
Objectif
Ce cours d'initiation s'adresse à des étudiants ayant peu de connaissances en informatique et désirant s’initier à la programmation.
Programme
Il s'agit d'établir les bases algorithmiques : notions de variables et déclaration, structures de données (tableaux, files,
piles), structures de contrôle élémentaires (conditionnelle, tests logiques, boucle). Les concepts algorithmiques doivent être intégrés
indépendamment d'un langage de programmation, c'est pourquoi les problèmes sont résolus à l'aide du pseudo-code.
Durant les dernières séances et selon le niveau d’avancement du groupe, les étudiants écrivent et exécutent leurs algorithmes à l’aide du langage de
programmation python.
Prérequis
Quelques notions algorithmiques sont les bienvenues, mais pas indispensables.
Mode d'évaluation
Examen écrit
Langage Java
Responsable
Objectif
Introduction à la programmation "objet". Développement de petites applications en Java
Programme
Syntaxe de base du langage JAVA
Création d'une classe simple : attributs, méthodes, constructeurs
Concepts objets : héritage, surcharge/redéfinition, classe abstraite, interface
Gestion des entrées/sorties
Ce module fait l'objet de nombreux TP de programmation et d'une étude de cas qui est notée.
Mode d'évaluation
Examen écrit et projet
Logiciels statistiques
Intervenants
Programme
- SAS, Splus, Spad, Matlab.
- Utilisation des procédures. Programmation.
- Documentation : SAS, MATLAB SPLUS
Nombres d'heures
20h de TD
Modèle linéaire et analyse des données
Responsable
Intervenants
Jérôme Pagès, Marine Cadoret, Magalie Houée-Bigot , Julie Josse, Maela Kloareg
Objectif
Rendre les étudiants autonomes dans les traitements statistiques les plus courants.
Programme
Modèle linéaire (Y = Xβ + ε) : régression linéaire multiple ; analyse de la variance à plusieurs facteurs croisés.
Initiation à la planification expérimentale (plans fractionnaires).
Analyse des données : analyse en composantes principales.
Prérequis
UC Statistique générale; Algèbre linéaire : représentation géométrique dans un espace vectoriel, calcul matriciel, orthogonalité, projection
Nombres d'heures
8 h de cours et 20 h de travaux dirigés
Mode d'évaluation
deux examens écrits en TD (2 x 1h) + projet à rendre et à soutenir oralement peu après le dernier TD.
Bibliographie
Pagès J. (2010) Statistiques générales pour utilisateurs. Méthodologie. 2e ed. 264 p. Presses Universitaires de Rennes.
Husson F. & Pagès J. (2005) Statistiques générales pour utilisateurs. Exercices et corrigés. 324 p. Presses Universitaires de Rennes. 300p.
Statistique générale
Responsable
Intervenants
Jérôme Pagès, Marine Cadoret, Yuna Blum, Minh-Tâm Lê, Julie Josse
Objectif
Donner aux étudiants les outils de base du traitement statistique.
Programme
Statistique exploratoire univariée.
Estimation ponctuelle et par intervalle.
Comparaison de deux moyennes ; comparaison de deux variances.
Analyse de variance à un et deux facteurs (sans interaction) : modèle, estimation, tests.
Etude de la liaison entre deux variables quantitatives ; corrélation ; régression simple (modèle, estimation, test).
Prérequis
fonction de densité d'une variable, variables aléatoires binomiale, hypergéométrique et normale
Nombres d'heures
10h de cours et 18h de travaux dirigés
Mode d'évaluation
deux examens écrits en TD (2 x 1h) + projet à rendre et à soutenir oralement peu après le dernier TD.
Bibliographie
Pagès J. (2010) Statistiques générales pour utilisateurs. Méthodologie. 2e ed. 264 p. Presses Universitaires de Rennes.
Husson F. & Pagès J. (2005) Statistiques générales pour utilisateurs. Exercices et corrigés. 324 p. Presses Universitaires de Rennes. 300p.
Système de gestion de bases de données
Responsable
Objectif
Apprendre à réfléchir et à analyser un problème avant de chercher à le traiter avec un outil (quel qu'il soit). L'enseignement est centré sur l'apprentissage de la gestion de bases de données relationnelles. À l'issue, l'étudiant doit être capable de construire un modèle de base de données adapté aux spécificités d'un problème, de formuler des requêtes et de s'adapter à tout système de gestion, cela grâce à la compréhension des principes fondamentaux qu'il aura acquis.
Programme
- Préambule sur la gestion de données et l'intérêt des bases de données.
- Modèle relationnel et normalisation : dictionnaire de données, dépendances fonctionnelles, clefs et formes normales.
- Requêtes : algèbre relationnelle et introduction au SQL
Le cours s’appuie sur de nombreuses études de cas et des applications sur les systèmes de gestion de bases de données Access et MySQL.
Mode d'évaluation
Examen écrit
Stage de fin d'études
Programme
Suivi du stage
Le stage est suivi par le tuteur enseignant, par courrier électronique essentiellement, et par le tuteur de l'entreprise, sur place.
Tutorat universitaire
Tous les enseignants intervenant dans la formation participent à l’encadrement des stagiaires.
Tutorat professionnel
Les entreprises désignent les tuteurs professionnels.
Nombres d'heures
6 mois minimum
Mode d'évaluation
Le stage est évalué par un rapport écrit, et une soutenance orale devant un jury comportant en général trois personnes : le tuteur de l'entreprise, le tuteur enseignant et un autre enseignant.
Analyse de données textuelles
Responsable
Intervenants
Objectif
Rendre les étudiants autonomes dans l’application des méthodes d’analyse des données aux questions ouvertes dans les enquêtes.
Programme
- Les textes comme données statistiques
- Glossaires de mots et segments. Concordances.
- Codification des textes
- Méthodes d’analyse
- Analyse de correspondances en analyse textuelle
- Mots et réponses caractéristiques
- Classification en analyse textuelle
- Analyse factorielle multiple étendue aux tableaux de contingence
- Autres types d’application
Les méthodes sont présentées à partir d’une étude de cas. Les exposés théoriques sont principalement des rappels de méthodes étudiées dans d’autres modules. La problématique des questions ouvertes dans les enquêtes est privilégiée, bien que d’autres applications soient aussi mentionnées.
Prérequis
Module Analyses factorielles
Nombres d'heures
20h
Mode d'évaluation
Etude de cas
Bibliographie
Escofier B., Pagès J. (2008) : Analyses Factorielles Simples et Multiples. 4e éd. 318p Dunod.
Lebart L., Salem A. (1994) Statistique textuelle. 342p Dunod.
Lebart L., Salem A., Berry L. (1998) Exploring textual data. 264 p Kluwer Academic Publishers
Analyse de la variance
Responsable
Intervenants
Objectif
Connaître les principaux modèles d'analyse de variance.
Programme
- Analyse de variance à effets fixes
- Modèle à 1 facteur
- Modèle à 2 facteurs et plus avec interaction
- Hypothèses, estimation, table ANOVA
- Tests de comparaisons multiples, contrastes.
- Analyse de variance à effets aléatoires
- Modèle à 1 facteur, 2 facteurs et plus avec interaction
- Estimation des composantes de la variance
- Analyse de variance à effets mixtes
- Modèle à 2 facteurs et plus avec interaction
- Estimation des composantes de la variance
- Analyse de variance avec effets hiérarchisés
- Analyse de la covariance Comparaison de droites de régression
Prérequis
UC Statistique générale - Algèbre linéaire : représentation géométrique dans un espace vectoriel, calcul matriciel, orthogonalité, projection
Nombres d'heures
8h de cours et 16h de travaux dirigés
Mode d'évaluation
Examen écrit de (2 h) + étude statistique
Bibliographie
- DAGNÉLIE P. (1998) Statistique théorique et appliquée De Boeck & Larcier.
- MC CULLAGH P. & NELDER J.A. (1989) Generalized linear models Chapman & Hall
- Sahai H. & Ageel M.I. (2000) The analysis of variance : Fixed random and Mixed models, Birkhäuser Boston
- SCHEFFE H. (1959) The analysis of variance Wiley
- CISIA-CERESTA. (1995) : Aide mémoire pratique des techniques statistique
Analyse discriminante
Responsable
Philippe Michel (Statisticien au ministère de l'Agriculture)
Intervenants
Philippe Michel (Statisticien au ministère de l'Agriculture)
Objectif
Rendre les étudiants autonomes dans la pratique de l’analyse discriminante.
Programme
- Analyse Factorielle Discriminante Linéaire
- Compléments
- Cas particulier de deux groupes
- Analyse Discriminante « bayésienne »
- Exemple
Prérequis
Calcul matriciel, Analyse Factorielle
Nombres d'heures
12 heures de cours
Mode d'évaluation
Examen écrit avec documents
Bibliographie
- Nakache JP & Confais J (2003) Statistique explicative appliquée. 278 p. Editions Technip.
- Huberty CJ (1994) Applied discriminant analysis. 324 p. J. Wiley.
- Saporta G (1990) Probabilités Analyse des données et Statistique. 488 p. Editions Technip.
Analyse factorielle
Responsable
Intervenants
Objectif
Rendre les étudiants autonomes dans l’analyse factorielle de tableaux multiples.
Programme
Analyse en composantes principales
Analyse factorielle des correspondances
Analyse des correspondances multiples
Analyse factorielle multiple
Analyse procustéenne
Modèle Indscal
Analyse factorielle multiple hiérarchique
Prérequis
UC Modèle linéaire et analyse des données ; UC Analyse des données multidimensionnelles et text mining
Nombres d'heures
28
Mode d'évaluation
Examen en temps limité (2 heures) ; question théorique + étude de cas.
Bibliographie
Husson F., Lê S. & Pagès J. (2009) Analyse des données avec R. 224 p. Presses Universitaires de Rennes.
Escofier B., Pagès J. (2008). Analyses Factorielles Simples et Multiples. 4e éd. 318p Dunod.
Classification
Responsable
Intervenants
Objectif
Rendre les étudiants autonomes dans la classification automatique.
Programmer une macro SAS permettant de réaliser une classification avec l’algorithme des centres mobiles.
Programme
- Classification ascendante hiérarchique.
- Méthodes de partitionnement direct.
- Modèles de mélange.
- Classification de variables continues.
Nombres d'heures
15 heures de cours
Mode d'évaluation
Examen écrit et projet
Modélisation non-linéaire et non-paramétrique
Responsable
Objectif
Ce module a pour objectif de prolonger les connaissances et compétences acquises dans les modules de 1ère année en matière de modélisation linéaire, à des situations nécessitant le recours, soit à des méthodes d'estimation plus complexes, soit à des modèles intégrant des effets non-linéaires. A titre illustratif, l'analyse de données à haut-débit telles que celles issues de spectrométrie proche infra-rouge nécessite des méthodes statistiques adaptées à la grande dimension des données (PLS, LASSO, ...) et des modèles statistiques tenant compte du caractère fonctionnel des spectres (Splines, GAM, ...).
L'enseignement donne une place importante à l'analyse effective de données par l'utilisation de différentes librairies de l'environnement libre d'analyse statistique R. Il insiste aussi sur la nécessaire interaction entre le statisticien et son interlocuteur dans la démarche de modélisation.
Programme
Le module est divisé en quatre blocs :
- Modèle linéaire en grande dimension : sélection de modèles, PLS, régularisation
- Modélisation non-linéaire : approche systémique, modèle d'une dynamique par un système d'équations différentielles
- Modélisation de données fonctionnelles : modèles GAM, Splines
- Modèle pour données catégorielles : extension des modèles vus précédemment au périmètre du GLM
Prérequis
Modèle linéaire, Modèle linéaire généralisé
Nombres d'heures
38
Mode d'évaluation
Examen écrit en temps limité.
Méthodes bayésiennes
Responsable
Intervenants
Julie Josse, Jean-Baptiste Denis, Etienne Rivot
Objectif
Initier les étudiants aux méthodes Bayesiennes et aux réseaux Bayesiens
Programme
Statistique Bayésienne :
Historique – Approche Bayesienne / Approche Fréquentiste
Inférence Bayésienne (théorème de Baye, loi a priori, loi a posteriori)
Introduction aux méthodes d’estimation par simulation de Monte-Carlo
Quelques modèles
Réseaux Bayésiens :
Motivation-Exemples
Cadre formel (définition, propriétés)
Construction- unicité - causalité - variable discrète, continue
L’approche Bayesienne est présentée à travers de nombreux exemples concrets ( halieutique, écologie, médicale, etc.) . L’enseignement est organisé en cours-TD etTP sur informatique (avec l’utilisation de logiciels spécifiques de calcul Bayésien).
Nombres d'heures
24h
Mode d'évaluation
Compte-rendu de TD-TP
Bibliographie
Robert, C.P. (2006) : Le choix Bayésien – Principe et pratique. Springer.
Bishop, C.M. (2006) : Pattern recognition and machine learning (chapter 8). Spinger.
Plans d'expériences
Responsable
Intervenants
François Husson, Marc Danzart
Objectif
Construction de plans d'expériences avancés utilisables dans l'industrie agro-alimentaire.
Programme
- Plans d'expériences en agro-alimentaire
- Plans en bloc incomplet équilibré
- Plan D-optimaux
- Plan de mélange
- Etude des surfaces de réponses
- Recherche d'un optimum sur une surface de réponse
- Recherche d'un optimum dans plusieurs surfaces de réponse
Nombres d'heures
9h de cours
Programmation Python
Responsable
Gabriel Jalam
Intervenants
Gabriel Jalam, Sébastien Lê
Objectif
Réaliser une application en Python qui appelle R en combinant connaissances en Python et en statistiques (analyse factorielle, modélisation).
Nombres d'heures
15 heures de cours
Mode d'évaluation
Projet
Programmation SAS
Responsable
Intervenants
Objectif
Programmer une macro SAS permettant de réaliser une analyse en composante principale avec l’algorithme NIPALS.
Nombres d'heures
15 heures de cours
Mode d'évaluation
Examen écrit et projet
Sensométrie avancée
Responsable
Intervenants
Objectif
Manipuler des jeux de données complexes; comparer les méthodes de recueil de données sensorielles
Programme
Présentation des méthodes holistiques : catégorisation, napping, napping catégorisé.
Comparaison de méthodes d'analyse sensorielle
Données de préférences
Nombres d'heures
12 heures de cours
Visual Basic pour Application et RExcel
Responsable
Gabriel Jalam
Intervenants
Gabriel Jalam, Sébastien Lê
Objectif
Réaliser une application dans Excel qui appelle R en combinant connaissances en VBA et en statistiques (analyse factorielle, modélisation, sensométrie).
Programme
- Langage VBA.
- Langage VBA développé pour RExcel.
Nombres d'heures
15 heures de cours
Mode d'évaluation
Projet
Projet d'ingénieur
Programme
Le projet d’ingénieur peut-être de deux types :
- une étude de cas complète, comportant une phase de recherche bibliographique, un recueil de données, la mise en œuvre de différentes méthodes, leur comparaison et l’analyse de leurs apports respectifs quant au problème considéré ;
- une recherche méthodologique, articulée autour d’une problématique concrète.
Ressources d'Agrocampus pour les étudiants :
Les étudiants ont accès à toutes les facilités d’Agrocampus en matière de professionnalisation :
- ils bénéficient de conférences sur les débouchés professionnels (le forum emploi en début d’année: 31 organismes présents, 61 offres de stages et 12 offres d’emplois),
- ils ont accès à la cellule d’insertion professionnelle qui organise des simulations d’entretiens d’embauches, met à disposition des élèves une documentation spécialisée sur les métiers, les entreprises, les organismes, en vue de la recherche d'emploi....
Ressources du laboratoire de mathématiques appliquées :
Pour favoriser l'insertion professionnelle des étudiants le laboratoire de Mathématiques appliquées propose également :
- des conférences de professionnels,
- des contacts fréquents avec les anciens étudiants permettant de garantir un enseignement proche des besoins des entreprises et une bonne insertion professionnelle des étudiants (stage ou recherche d'emploi).


