Podcast-News NAPS - Neues aus der Podcast-Szene Podcast Meldungen Berichte Kommentare Service-News Technik
Finde Podcasts Podcast-Tipps Podcast-Charts Podcast-Verzeichnis Podcast-Kategorien
Mache Podcasts In 5 Minuten zu... Podcast Podcast-Wissen Podcasting-FAQ Podcaster Podcast-Hosting Podcast-Studio Berlin
Erlebe Podcasts Gezielt - Der Reichweiten-Podcast Podcast-Events Podcast-Jobs

Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

37 Minuten

25.21 MB

Podcast

Podcaster

Knowledge Science - Alles über KI, ML und NLP

Wissenschaft , Bildung , Technologie

Beschreibung

vor 6 Monaten

Send us a text

In der heutigen Sendung versuchen wir rauszufinden, ob man sich
auf die öffentlichen Benchmarks zum Testen und Vergleichen von
Sprachmodellen verlassen kann. Oder ob Benchmark Testdaten zum
Trainieren verwendet werden. Hierbei handelt es sich um das
Benchmark Leakage. Hören Sie rein.

Wir sprechen vor allem über das Paper: Benchmarking Benchmark
Leakage in Large Language Models https://arxiv.org/abs/2404.18824

Support the show