Bienvenue !

Le site eManulex permet d'interroger facilement les bases Manulex qui constituent une description complète de la langue française écrite adressée à l'enfant à l'école primaire. Les bases Manulex sont à la disposition des chercheurs qui travaillent sur l'acquisition de l'écrit et ses dysfonctionnements mais également des enseignants qui pourront extraire de ces tables de fréquence, des listes de mots adaptées aux enfants de cycle 2 et 3.

Les recherches peuvent être effectuées sur plusieurs critères selon le niveau d'acquisition souhaité : CP, CE1, Cycle 3 (CE2-CM2), ou sur l'ensemble des niveaux. Les résultats peuvent être exportés dans un fichier de tableur au format CSV, compatible avec MS Excel et Open-Office Calc. Les requêtes complexes sont simplifiées grâce à un assistant qui permet en particulier de faciliter les saisies lorsque des critères de texte sont requis.

Nous espérons que ce site d'interrogation en ligne facilitera votre travail. Merci de vous reporter à la section Citations pour vos références.

Les bases Manulex ainsi que le contenu des requêtes issues du site eManulex sont protégées selon les termes de la licence Creative Commons :Paternité-Pas d'Utilisation Commerciale-Partage des Conditions Initiales à l'Identique 3.0 International.

Manulex

Manulex est une base de données lexicales qui fournit les fréquences d'occurrences de mots calculées à partir d'un corpus de 54 manuels scolaires (1,9 millions de mots). Les listes de fréquences de mots sont fournies pour trois niveaux d'expertise de la lecture : le CP (6 ans) où se construit le lexique de l'enfant sur la base de la médiation phonologique, le CE1 (7 ans) où se construit le lexique orthographique par automatisation progressive de la reconnaissance du mot écrit et le cycle 3 (CE2-CM2, 8-11 ans) où se consolide et s'enrichit le stock lexical par exposition répétée à l'écrit. Un quatrième niveau est constitué par le regroupement de l'ensemble des manuels du CP au CM2 représentant ainsi l'écrit adressé à l'enfant à l'école primaire.

Manulex est constituée de deux lexiques pour les 4 niveaux considérés : un lexique de 48 900 formes orthographiques différentes rencontrées dans les manuels (chantons, chanteraient, bateau, bateaux, …) et un lexique de 23 900 lemmes pour lesquels la fréquence correspond à la somme des fréquences des formes orthographiques (chanter = chantons + chanteraient, bateau = bateau + bateaux, …).

Manulex-infra

Manulex-infra a été développée à partir de Manulex pour décrire les caractéristiques infra-lexicales des mots du lexique des formes orthographiques (45 000 entrées retenues).

La grande nouveauté réside dans la mise à disposition d'un indice de difficulté orthographique — ou consistance orthographique — calculé pour le début, le milieu, la fin et le mot en entier, ceci pour les 45 000 mots retenus et pour les 4 niveaux de Manulex. Au moment d'écrire ces lignes (rentrée 2010), Manulex-infra n'a pas d'équivalent dans d'autres langues.

D'autres statistiques sont disponibles sur les fréquences des bigrammes, biphones et syllabes ainsi que sur les fréquences des associations graphème-phonème. Le voisinage orthographique et phonologique est également décrit aux 4 niveaux pour chaque mot (densité et fréquence). D'autres indicateurs de discriminabilité des mots comme l'homophonie, l'homographie, … sont également disponibles.

Manulex-morpho

Manulex-morpho (Peereman, Sprenger-Charolles, & Messaoud-Galusi, 2013) prolonge la description des associations graphème-phonème et phonème-graphème initiée dans Manulex-infra en considérant l'apport de l'information mophologique (essentiellement flexionnelle) à la consistance des associations GP et PG.

Le corpus lexical étudié correspond approximativement aux 10.000 mots les plus fréquents de la base Manulex. Quatre catégories d'indices morphologiques ont été utilisées pour marquer les graphèmes et phonèmes. La majorité des indices s'applique aux finales de mots. 1) flexions de genre et de nombre, 2) flexions verbales, 3) morphographème -ent des adverbes en -ment, 4) consonnes finales qui peuvent être silencieuses dans le mot, mais prononcées dans les formes fléchies ou dérivées (consonnes comme support de flexion/dérivation; e.g., "d" dans grand-grande-grandeur).

Pour l'instant cette base n'est pas interrogeable en ligne. Les descriptions statistiques par mot ou par association GP/PG (fichiers excel) sont accessibles sur le site de Manulex-morpho.

Auteurs

Voici la liste des auteurs des bases Manulex et du site eManulex. Vous trouverez des informations plus complètes sur nos travaux sur nos pages respectives. Certaines publications sont disponibles sur la page Télécharger.

Website

La version électronique du site eManulex a été développée par :

Bernard Lété Professeur de Psychologie Cognitive, Université Lumière Lyon 2, Laboratoire d’Étude des Mécanismes Cognitifs (EA 3082)
Éric Ortega

Manulex

La base Manulex a été développée par :

Bernard Lété Professeur de Psychologie Cognitive, Université Lumière Lyon 2, Laboratoire d’Étude des Mécanismes Cognitifs (EA 3082)
Liliane Sprenger-Charolles Senior researcher (Emeritus), Aix-Marseille Université, Laboratoire de Psychologie Cognitive (UMR 7290)
Pascale Colé Professeur de Psychologie Cognitive, Aix-Marseille Université, Laboratoire de Psychologie Cognitive (UMR 7290)

Manulex-infra

La base Manulex-infra a été développée par :

Ronald Peereman Chargé de Recherche CNRS, Université Grenoble Alpes, Laboratoire de Psychologie et NeuroCognition (UMR 5105)
Bernard Lété Professeur de Psychologie Cognitive, Université Lumière Lyon 2, Laboratoire d’Étude des Mécanismes Cognitifs (EA 3082)
Liliane Sprenger-Charolles Senior researcher (Emeritus), Aix-Marseille Université, Laboratoire de Psychologie Cognitive (UMR 7290)

Citations

Pour Manulex :

Lété, B., Sprenger-Charolles, L., & Colé, P. (2004). Manulex: A grade-level lexical database from French elementary-school readers. Behavior Research Methods, Instruments, & Computers, 36, 156-166.

Pour Manulex-infra :

Peereman, R., Lété, B., & Sprenger-Charolles, L. (2007). Manulex-infra: Distributional characteristics of grapheme-phoneme mappings, infra-lexical and lexical units in child-directed written material. Behavior Research Methods, 39, 593-603.

Pour Manulex-morpho :

Peereman, R., Sprenger-Charolles, L., & Messaoud-Galusi, S. (2013). The contribution of morphology to the consistency of spelling-to-sound relations: A quantitative analysis based on French elementary school readers. Annee Psychologique, 113, 3-33.

Pour la version électronique eManulex :
Ortega, É., & Lété, B. (2010). eManulex: Electronic version of Manulex and Manulex-infra databases. Retrieved from http://www.manulex.org.

Note : la référence à la version électronique doit toujours être associée aux références des versions papiers.