Conditions d'utilisation

Contrat Creative Commons

Les données des bases Manulex et Manulex-infra (ce qui inclut les résultats des requêtes) sont mises à disposition selon les termes de la licence Creative Commons Paternité - Pas d'Utilisation Commerciale - Partage des Conditions Initiales à l'Identique 3.0 Unported.

Toute utilisation en dehors du champ de cette licence doit faire l'objet d'une autorisation préalable (contactez-nous).

Chiffres clés
  • 54 manuels

  • 1.9 millions de mots extraits

  • 48,886 wordforms

  • 23,812 lemmas

Contact

N'hésitez pas à nous adresser toute question, remarque ou suggestion.

Si vous découvrez un dysfonctionnement sur le site, nous vous remercions de nous le signaler, nous ferons notre possible pour le corriger au plus vite !

Email de contact : Bernard Lété

Formulaire de contact

Financement
ANR Logo

Le site eManulex a été financé par deux allocations de l'Agence Nationale pour la Recherche à Bernard Lété :

  • Developing a neuro-computational model of learning to read (ANR-06-BLAN-0337-03)

  • Differential Diagnostic of learning of mild-retarded children (ANR-06-APPR-005)

Les recherches ont été dirigées, respectivement, par Jonathan Grainger et Bernard Lété

Crédits

Graphics
Le site eManulex utilise des ressources partagées gratuitement sur le Web. Nous sommes heureux de remercier leurs auteurs : les icônes de drapeaux par mayosoft, ainsi que les icônes du projet Tango Desktop Library...

Bienvenue !

Le site eManulex permet d'interroger facilement les bases Manulex qui constituent une description complète de la langue française écrite adressée à l'enfant à l'école primaire. Les bases Manulex sont à la disposition des chercheurs qui travaillent sur l'acquisition de l'écrit et ses dysfonctionnements mais également des enseignants qui pourront extraire de ces tables de fréquence, des listes de mots adaptées aux enfants de cycle 2 et 3.

Les recherches peuvent être effectuées sur plusieurs critères selon le niveau d'acquisition souhaité : CP, CE1, Cycle 3 (CE2-CM2), ou sur l'ensemble des niveaux. Les résultats peuvent être exportés dans un fichier de tableur au format CSV, compatible avec MS Excel et Open-Office Calc. Les requêtes complexes sont simplifiées grâce à un assistant qui permet en particulier de faciliter les saisies lorsque des critères de texte sont requis.

Nous espérons que ce site d'interrogation en ligne facilitera votre travail. Merci de vous reporter à la section Citations pour vos références.

Les bases Manulex ainsi que le contenu des requêtes issues du site eManulex sont protégées selon les termes de la licence Creative Commons :Paternité-Pas d'Utilisation Commerciale-Partage des Conditions Initiales à l'Identique 3.0 International.

Manulex

Manulex est une base de données lexicales qui fournit les fréquences d'occurrences de mots calculées à partir d'un corpus de 54 manuels scolaires (1,9 millions de mots). Les listes de fréquences de mots sont fournies pour trois niveaux d'expertise de la lecture : le CP (6 ans) où se construit le lexique de l'enfant sur la base de la médiation phonologique, le CE1 (7 ans) où se construit le lexique orthographique par automatisation progressive de la reconnaissance du mot écrit et le cycle 3 (CE2-CM2, 8-11 ans) où se consolide et s'enrichit le stock lexical par exposition répétée à l'écrit. Un quatrième niveau est constitué par le regroupement de l'ensemble des manuels du CP au CM2 représentant ainsi l'écrit adressé à l'enfant à l'école primaire.

Manulex est constituée de deux lexiques pour les 4 niveaux considérés : un lexique de 48 900 formes orthographiques différentes rencontrées dans les manuels (chantons, chanteraient, bateau, bateaux, …) et un lexique de 23 900 lemmes pour lesquels la fréquence correspond à la somme des fréquences des formes orthographiques (chanter = chantons + chanteraient, bateau = bateau + bateaux, …).

Manulex-infra

Manulex-infra a été développée à partir de Manulex pour décrire les caractéristiques infra-lexicales des mots du lexique des formes orthographiques (45 000 entrées retenues).

La grande nouveauté réside dans la mise à disposition d'un indice de difficulté orthographique — ou consistance orthographique — calculé pour le début, le milieu, la fin et le mot en entier, ceci pour les 45 000 mots retenus et pour les 4 niveaux de Manulex. Au moment d'écrire ces lignes (rentrée 2010), Manulex-infra n'a pas d'équivalent dans d'autres langues.

D'autres statistiques sont disponibles sur les fréquences des bigrammes, biphones et syllabes ainsi que sur les fréquences des associations graphème-phonème. Le voisinage orthographique et phonologique est également décrit aux 4 niveaux pour chaque mot (densité et fréquence). D'autres indicateurs de discriminabilité des mots comme l'homophonie, l'homographie, … sont également disponibles.

Auteurs

Voici la liste des auteurs des bases Manulex et du site eManulex. Vous trouverez des informations plus complètes sur nos travaux sur nos pages respectives. Certaines publications sont disponibles sur la page Télécharger.

Website

La version électronique du site eManulex a été développée par :

Manulex

La base Manulex a été développée par :

  • Bernard Lété, Université Lyon 2, Laboratoire d'Étude des Mécanismes Cognitifs, Lyon, France
  • Liliane Sprenger-Charolles, CNRS & Université Paris Descartes, Laboratoire de Psychologie de la Perception, Paris, France
  • Pascale Colé, CNRS & Université de Provence, Laboratoire de Psychologie Cognitive, Marseille, France

Manulex-infra

La base Manulex-infra a été développée par :

  • Ronald Peereman, CNRS & Université Pierre Mendes France, Laboratoire de Psychologie et Neurocognition, Grenoble, France
  • Bernard Lété, Université Lyon 2, Laboratoire d'Étude des Mécanismes Cognitifs, Lyon, France
  • Liliane Sprenger-Charolles, CNRS & Université Paris Descartes, Laboratoire de Psychologie de la Perception, Paris, France

Citations

Pour Manulex :

Lété, B., Sprenger-Charolles, L., & Colé, P. (2004). Manulex: A grade-level lexical database from French elementary-school readers. Behavior Research Methods, Instruments, & Computers, 36, 156-166.

Pour Manulex-infra :

Peereman, R., Lété, B., & Sprenger-Charolles, L. (2007). Manulex-infra: Distributional characteristics of grapheme-phoneme mappings, infra-lexical and lexical units in child-directed written material. Behavior Research Methods, 39, 593-603.

Pour la version électronique eManulex :

Ortéga, É., & Lété, B. (2010). eManulex: Electronic version of Manulex and Manulex-infra databases. Retrieved from http://www.manulex.org.

Note : la référence à la version électronique doit toujours être associée aux références des versions papiers.