Comprendre le F1 Score en machine learning : la moyenne harmonique de la precision et du rappel
Dans cet article, nous allons approfondir le concept du F1 score, sa relation avec la precision et le rappel, et pourquoi il est avantageux d'utiliser le F1 score.
Picsellia Team
·8 min read

Livrez vos modeles plus vite
Suivez vos experiences, comparez les executions et iterez plus rapidement avec des outils integres.
Introduction :
Dans le domaine du machine learning, evaluer avec precision la performance d'un modele est crucial. Des metriques telles que la precision, le rappel et le F1 score jouent un role significatif dans l'evaluation de l'efficacite d'un modele de classification. Dans cet article, nous allons approfondir le concept du F1 score, sa relation avec la precision et le rappel, pourquoi il est avantageux d'utiliser le F1 score plutot que de se fier uniquement au rappel ou a la precision, comment interpreter les resultats, comment utiliser le F1 score en machine learning avec un exemple de vision par ordinateur, et enfin, introduire le concept de matrice de confusion pour calculer le F1 score.
Comprendre la precision et le rappel :
Avant d'explorer le F1 score, il est important de comprendre deux metriques fondamentales : la precision et le rappel.
Precision :
La precision mesure la proportion d'instances positives correctement predites parmi toutes les instances predites comme positives. Elle nous aide a comprendre dans quelle mesure le modele classe correctement les instances positives. Une valeur de precision elevee indique que le modele a un faible taux de faux positifs.
La precision est calculee a l'aide de la formule :
Understanding the f1 score in machine learning the harmonic mean of precision and recall 646f6d5cd7373ddc1cbc8ce8 ce88bfab
ou :
- Les vrais positifs sont les instances positives correctement predites
- Les faux positifs representent les instances incorrectement predites comme positives.
La precision est particulierement utile lorsque l'objectif est de minimiser les faux positifs. Les faux positifs se produisent lorsque des instances negatives sont incorrectement classees comme positives par le modele. Par exemple, dans la detection de spam par e-mail, un faux positif signifierait classer un e-mail legitime comme spam.
Rappel :
Le rappel, egalement connu sous le nom de sensibilite ou taux de vrais positifs, mesure la proportion d'instances positives correctement predites parmi toutes les instances positives reelles. Il fournit des informations sur la capacite du modele a identifier les instances positives. Une valeur de rappel elevee indique que le modele a un faible taux de faux negatifs.
Le rappel est calcule a l'aide de la formule :
Understanding the f1 score in machine learning the harmonic mean of precision and recall 646f6d5c4d8cc8dc4f5306e7 d6e8fb07
ou :
- Les vrais positifs sont les instances positives correctement predites
- Les faux negatifs representent les instances incorrectement predites comme negatives.
Le rappel est particulierement utile lorsque l'objectif est de minimiser les faux negatifs. Les faux negatifs se produisent lorsque des instances positives sont incorrectement classees comme negatives par le modele. Par exemple, dans un scenario de diagnostic medical, un faux negatif signifierait ne pas identifier une maladie ou une condition alors qu'elle est reellement presente.
Mais que faire si nous voulons trouver le meilleur compromis entre la precision et le rappel ? Nous devrions trouver un moyen de calculer une metrique qui prenne en compte les deux et l'optimiser ! Eh bien, la moyenne harmonique est un excellent concept pour calculer cela.
La moyenne harmonique est un concept mathematique utilise pour calculer une valeur moyenne d'une maniere qui donne un poids egal a chaque valeur moyennee, quelle que soit leur magnitude. Elle est couramment utilisee lorsqu'on traite des taux, des ratios ou d'autres grandeurs impliquant des reciproques.
Elle est calculee en prenant la reciproque de chaque valeur, en calculant la moyenne arithmetique des reciproques, puis en prenant la reciproque du resultat. Mathematiquement, la moyenne harmonique de n valeurs, x1, x2, ..., xn, est donnee par :
Understanding the f1 score in machine learning the harmonic mean of precision and recall 646f6d60cabd245d7cc955ba 970413e8
Voici quelques points cles a comprendre sur la moyenne harmonique :
- Ponderation egale : Contrairement a la moyenne arithmetique, qui donne un poids egal a chaque valeur moyennee, la moyenne harmonique donne un poids egal a la reciproque de chaque valeur. Cela signifie que les petites valeurs ont un impact plus significatif sur la moyenne harmonique que les grandes valeurs.
- Influence des valeurs extremes : La moyenne harmonique est fortement influencee par les petites valeurs. S'il y a ne serait-ce qu'une seule petite valeur dans l'ensemble des valeurs moyennees, la moyenne harmonique tendra vers cette valeur.
- Utilisation pour les taux et les ratios : La moyenne harmonique est particulierement utile pour moyenner des taux, des ratios ou d'autres grandeurs impliquant des reciproques. Par exemple, elle est couramment utilisee pour calculer des vitesses moyennes ou des taux de travail moyens.
Dans le contexte de l'evaluation du F1 score, la moyenne harmonique est utilisee pour combiner la precision et le rappel. Puisque la precision et le rappel sont tous deux des taux (ratios) entre 0 et 1, la moyenne harmonique aide a equilibrer ces deux metriques en considerant leurs reciproques. Cela garantit qu'une faible valeur de precision ou de rappel a un impact significatif sur le F1 score global, incitant ainsi a un equilibre entre les deux.
Passez à la vitesse supérieure
Picsellia centralise vos données, vos modèles et vos déploiements dans une seule plateforme. Voyez comment en 30 minutes.
Rejoignez des centaines d'ingenieurs CV qui livrent des modeles plus vite avec Picsellia
Presentation du F1 Score :
Le F1 score combine la precision et le rappel en une seule metrique, fournissant une evaluation equilibree de la performance d'un modele. Bien que le rappel et la precision soient importants individuellement, les utiliser seuls peut ne pas fournir une evaluation complete. Le F1 score prend en compte les deux metriques et leur moyenne harmonique, nous permettant de trouver un equilibre entre la minimisation des faux positifs et des faux negatifs. Le F1 score varie de 0 a 1, ou 1 represente une precision et un rappel parfaits, et 0 indique une mauvaise performance.
Avantages de l'utilisation du F1 Score :
Le F1 score offre plusieurs avantages par rapport a l'utilisation exclusive du rappel ou de la precision :
- Equilibre entre precision et rappel : Le F1 score considere a la fois la precision et le rappel et accorde une importance egale aux deux metriques. Cela garantit que le modele n'optimise pas uniquement la precision ou le rappel, mais trouve plutot un equilibre entre la prediction correcte des instances positives et la minimisation des faux positifs et faux negatifs.
- Robustesse face aux datasets desequilibres : Dans les scenarios ou le dataset est desequilibre, c'est-a-dire qu'une classe a significativement moins d'instances que l'autre, utiliser le F1 score aide a attenuer les evaluations biaisees. Puisque le F1 score prend en compte a la fois la precision et le rappel, il fournit une evaluation equitable de la performance du modele dans de tels cas.
Interpretation des resultats et utilisation du F1 Score en machine learning :
L'interpretation du F1 score depend du probleme specifique et du contexte. Un F1 score eleve indique un modele performant avec une bonne precision et un bon rappel. En revanche, un F1 score faible suggere une marge d'amelioration, mettant en evidence des problemes potentiels avec la precision ou le rappel.
Considerons un exemple de detection d'objets utilisant un modele qui identifie des voitures dans des images. Nous voulons que le modele ait une haute precision pour s'assurer que lorsqu'il predit une voiture, c'est bien une voiture (minimisant les faux positifs). En meme temps, nous voulons egalement un rappel eleve pour capturer autant de voitures reelles que possible (minimisant les faux negatifs). En utilisant le F1 score, nous pouvons evaluer la capacite du modele a trouver un equilibre entre la precision et le rappel, fournissant une evaluation complete de sa performance.
Pour calculer le F1 score, nous pouvons utiliser une matrice de confusion, qui resume la performance predictive d'un modele sur une tache de classification binaire (classes positive et negative). La matrice de confusion se compose de quatre composants cles :
- Vrais positifs (VP) : Instances correctement predites comme positives.
- Vrais negatifs (VN) : Instances correctement predites comme negatives.
- Faux positifs (FP) : Instances incorrectement predites comme positives.
- Faux negatifs (FN) : Instances incorrectement predites comme negatives.
En utilisant ces composants, nous pouvons calculer le F1 score a l'aide de la formule suivante :
Understanding the f1 score in machine learning the harmonic mean of precision and recall 646f6d5cc49942bb62b1ec4b 1e19e32d
Conclusion
Le F1 score est une metrique puissante en machine learning pour evaluer la performance des modeles de classification. En incorporant a la fois la precision et le rappel, il fournit une mesure equilibree de la capacite d'un modele a classifier correctement les instances positives tout en minimisant les faux positifs et les faux negatifs. Utiliser le F1 score, aux cotes de la precision et du rappel, permet aux praticiens du machine learning de prendre des decisions eclairees lors du developpement et de l'affinage de leurs modeles. De plus, les avantages du F1 score, son interpretabilite et son applicabilite dans divers domaines, comme la vision par ordinateur, en font un outil essentiel pour evaluer et optimiser les modeles de machine learning.
Essayez Picsellia gratuitement
Lancez-vous avec vos propres données. Aucune carte de crédit requise.
Rejoignez des centaines d'ingenieurs CV qui livrent des modeles plus vite avec Picsellia
Suggestions Picsellia
Suivez chaque experience
Enregistrez automatiquement les metriques, parametres et artefacts. Comparez les executions cote a cote et livrez de meilleurs modeles plus vite.
Voir le suivi d'experiencesRestez informe
Recevez les derniers articles sur la vision par ordinateur, le MLOps et l'IA directement dans votre boite mail.
Articles associes

Fonctions d'activation et réseaux de neurones
Découvrez le rôle clé des fonctions d'activation dans les réseaux de neurones pour les tâches de vision par ordinateur. Apprenez-en plus sur Sigmoid, ReLU et d'autres pour un meilleur deep learning.

Mask R-CNN - Tout expliqué
Explorez Mask R-CNN : un outil révolutionnaire en vision par ordinateur pour la détection d'objets et la segmentation d'instances. Plongez dans son architecture et ses applications.

Comprendre le surapprentissage en machine learning
Apprenez a lutter contre le surapprentissage en machine learning avec des strategies efficaces et la plateforme MLOps de Picsellia. Evitez la memorisation du modele.