Podcast-News NAPS - Neues aus der Podcast-Szene Podcast Meldungen Berichte Kommentare Service-News Technik
Finde Podcasts Podcast-Tipps Podcast-Charts Podcast-Verzeichnis Podcast-Kategorien
Mache Podcasts In 5 Minuten zu... Podcast Podcast-Wissen Podcasting-FAQ Podcaster Podcast-Hosting Podcast-Studio Berlin
Erlebe Podcasts Gezielt - Der Reichweiten-Podcast Podcast-Events Podcast-Jobs

Episode 175 - Miniserie Interpretierbarkeit - Golden Gate Claude

30 Minuten

20.46 MB

Podcast

Podcaster

Knowledge Science - Alles über KI, ML und NLP

Wissenschaft , Bildung , Technologie

Beschreibung

vor 5 Monaten

Send us a text

In dieser faszinierenden Episode erkunden Sigurd Schacht und
Carsten Lanquillon, wie Anthropic's Forschung zur
Interpretierbarkeit von KI es ermöglicht, Sprachmodelle auf
Konzeptebene zu manipulieren. Sie diskutieren das
aufsehenerregende Golden Gate Claude-Experiment, bei dem ein
Sprachmodell dazu gebracht wurde, in jeder Konversation die
Golden Gate Bridge zu erwähnen, und erörtern die weitreichenden
Implikationen dieser Technologie für die Zukunft der KI-Steuerung
und -Sicherheit.

Support the show