Podcast-News NAPS - Neues aus der Podcast-Szene Podcast Meldungen Berichte Kommentare Service-News Technik
Finde Podcasts Podcast-Tipps Podcast-Charts Podcast-Verzeichnis Podcast-Kategorien
Mache Podcasts In 5 Minuten zu... Podcast Podcast-Wissen Podcasting-FAQ Podcaster Podcast-Hosting Podcast-Studio Berlin
Erlebe Podcasts Gezielt - Der Reichweiten-Podcast Podcast-Events Podcast-Jobs

KI-Benchmarks haben mehr Probleme als Lösungen

47 Minuten

54.92 MB

Podcast

Podcaster

Digital Podcast

Technologie

Beschreibung

vor 7 Monaten

KI-Entwickler brüsten sich stolz mit den Zahlen, die ihre Systeme
in Benchmark-Tests erreichen. Wir erklären, wie KI-Benchmarks
funktionieren und fragen: Wie aussagekräftig sind solche Tests
wirklich? Und kommt es am Ende vielleicht bloss auf die «Vibes» an?
Der ganze Podcast im Überblick: (00:01:28) Was sind eigentlich
KI-Benchmark-Tests? (00:06:23) Neun Probleme (00:34:27) Drei
Lösungen Chatbot Arena: https://chat.lmsys.org SRF Geek Sofa bei
Discord: https://discord.gg/geeksofa