Navigation überspringen
Universitätsbibliothek Heidelberg
Status: Bibliographieeintrag
Standort: ---
Exemplare: ---

+ Andere Auflagen/Ausgaben
heiBIB
 Online-Ressource
Verfasst von:Dimitriadis, Timo [VerfasserIn]   i
 Gneiting, Tilmann [VerfasserIn]   i
 Jordan, Alexander I. [VerfasserIn]   i
 Vogel, Peter [VerfasserIn]   i
Titel:Evaluating probabilistic classifiers
Titelzusatz:the triptych
Verf.angabe:Timo Dimitriadis, Tilmann Gneiting, Alexander I. Jordan, Peter Vogel
E-Jahr:2023
Jahr:January 27, 2023
Umfang:32 S.
Fussnoten:Gesehen am 26.09.2023
Titel Quelle:Enthalten in: De.arxiv.org
Ort Quelle:[Erscheinungsort nicht ermittelbar] : Arxiv.org, 1991
Jahr Quelle:2023
Band/Heft Quelle:(2023) vom: Jan., Artikel-ID 2301.10803, Seite 1-32
Abstract:Probability forecasts for binary outcomes, often referred to as probabilistic classifiers or confidence scores, are ubiquitous in science and society, and methods for evaluating and comparing them are in great demand. We propose and study a triptych of diagnostic graphics that focus on distinct and complementary aspects of forecast performance: The reliability diagram addresses calibration, the receiver operating characteristic (ROC) curve diagnoses discrimination ability, and the Murphy diagram visualizes overall predictive performance and value. A Murphy curve shows a forecast's mean elementary scores, including the widely used misclassification rate, and the area under a Murphy curve equals the mean Brier score. For a calibrated forecast, the reliability curve lies on the diagonal, and for competing calibrated forecasts, the ROC and Murphy curves share the same number of crossing points. We invoke the recently developed CORP (Consistent, Optimally binned, Reproducible, and Pool-Adjacent-Violators (PAV) algorithm based) approach to craft reliability diagrams and decompose a mean score into miscalibration (MCB), discrimination (DSC), and uncertainty (UNC) components. Plots of the DSC measure of discrimination ability versus the calibration metric MCB visualize classifier performance across multiple competitors. The proposed tools are illustrated in empirical examples from astrophysics, economics, and social science.
DOI:doi:10.48550/arXiv.2301.10803
URL:Bitte beachten Sie: Dies ist ein Bibliographieeintrag. Ein Volltextzugriff für Mitglieder der Universität besteht hier nur, falls für die entsprechende Zeitschrift/den entsprechenden Sammelband ein Abonnement besteht oder es sich um einen OpenAccess-Titel handelt.

kostenfrei: Volltext: https://doi.org/10.48550/arXiv.2301.10803
 kostenfrei: Volltext: http://arxiv.org/abs/2301.10803
 DOI: https://doi.org/10.48550/arXiv.2301.10803
Datenträger:Online-Ressource
Sprache:eng
Bibliogr. Hinweis:Forschungsdaten: Dimitriadis, Timo: Replication package for "Evaluating probabilistic classifiers: the triptych"
Sach-SW:Computer Science - Machine Learning
 Statistics - Machine Learning
 Statistics - Methodology
K10plus-PPN:1860283985
Verknüpfungen:→ Sammelwerk

Permanenter Link auf diesen Titel (bookmarkfähig):  https://katalog.ub.uni-heidelberg.de/titel/69124552   QR-Code
zum Seitenanfang