Produit

Par répondant, groupe, question ou cohorteFiltres combinablesMéthodologie transparente

Un score de langue lisible, actionnable, et traçable.

Le score de niveau de langue combine lisibilité, structure des phrases, richesse lexicale, ponctuation et signaux de registre pour vous aider à interpréter les réponses ouvertes avec plus de finesse.

Niveau global

0 à 100

Un score synthétique pour comparer vos segments rapidement.

Lecture CECRL indicative

A1 à C2

Un repère pédagogique, pas une certification officielle.

Composantes visibles

5 familles

Chaque sous-score est affiché pour interpréter le résultat.

Méthodologie de calcul

1

1. Agrégation du périmètre

Le moteur agrège les réponses du périmètre sélectionné (question, répondant, groupe, cohorte) avec les mêmes filtres que vos autres analyses.

2

2. Extraction des métriques

Nous extrayons des indicateurs simples: longueur moyenne de phrase, densité lexicale, variété du vocabulaire, ponctuation, abréviations et mots hors langue dominante.

3

3. Normalisation des composantes

Chaque famille d'indicateurs est normalisée sur une échelle commune pour éviter qu'une métrique brute domine artificiellement le score.

4

4. Score composite et lecture

Le score final combine les composantes pondérées et propose une lecture indicative de niveau de langue (A1 à C2) pour faciliter la restitution.

Composantes suivies

Lisibilité

Estime la facilité de lecture avec des formules basées sur la longueur des phrases et des mots.

Structure syntaxique

Mesure la complexité des phrases via la variété des constructions et la profondeur structurelle.

Richesse lexicale

Observe la diversité des mots et la stabilité de la variété lexicale sur des textes de tailles différentes.

Ponctuation

Analyse la densité et la diversité de ponctuation comme indice de structuration du discours.

Registre d'expression

Détecte des signaux de registre: abréviations, mélange de langues et marqueurs informels.

Volumétrie de réponse

Intègre la longueur utile des réponses pour éviter les conclusions fragiles sur des verbatims trop courts.

Comment interpréter ce score

Comparer avant d'évaluer

Le score est particulièrement utile en comparaison: entre cohortes, entre groupes, ou avant/après un dispositif.

Lire les sous-scores

Un même score global peut provenir de profils linguistiques différents. Les composantes servent à expliquer ce qui change réellement.

Utiliser le contexte métier

Le niveau attendu dépend du contexte (formation, recrutement, diagnostic interne). Le score n'est pas une fin en soi.

Éviter les usages de sélection automatique

Nous recommandons un usage d'aide à la lecture et à la facilitation, jamais comme critère unique de décision individuelle.

Sources méthodologiques

Le score s'appuie sur des familles de métriques largement documentées dans la littérature en lisibilité, complexité linguistique et CECRL.

Chaise en bois et métal sur fond clair.

Flesch (1948) - readability

Article fondateur sur l'évaluation de lisibilité via des indicateurs de longueur.

Journal of Applied Psychology

Consulter la source
Tasse illustrée avec visage stylisé sur fond clair.

Kincaid et al. (1975) - formules de lisibilité

Rapport technique décrivant les formules de niveau scolaire et lisibilité.

U.S. Navy / University of Central Florida

Consulter la source
Baby-foot miniature en style 3D sur fond clair.

McCarthy & Jarvis (2010) - diversité lexicale

Comparaison de MTLD, vocd-D et HD-D pour mesurer la richesse lexicale.

Behavior Research Methods

Consulter la source
Fusée stylisée violette et orange sur fond clair.

Lu (2010) - complexité syntaxique

Travaux de référence sur l'analyse automatique de la complexité syntaxique en écriture L2.

International Journal of Corpus Linguistics

Consulter la source
Deux costumes stylisés présentés côte à côte.

CECRL Companion Volume (Conseil de l'Europe)

Descripteurs de niveaux A1 à C2 utilisés comme repère d'interprétation pédagogique.

Conseil de l'Europe

Consulter la source
Personnage montant un escalier vers un avion en style 3D.

GLUECoS (ACL 2020) - code-switching

Benchmark de référence pour l'analyse de textes multilingues et le mélange de langues.

Association for Computational Linguistics

Consulter la source

Certaines références académiques sont disponibles via DOI ou éditeurs scientifiques. Harmate applique ces principes de façon pragmatique pour une lecture opérationnelle des réponses ouvertes.

Pages liées

Mesurez la qualité linguistique de vos réponses ouvertes

Activez le score de langue dans vos analyses Harmate et comparez vos populations avec des composantes explicites.