Podcast-News NAPS - Neues aus der Podcast-Szene Podcast Meldungen Berichte Kommentare Service-News Technik
Finde Podcasts Podcast-Tipps Podcast-Charts Podcast-Verzeichnis Podcast-Kategorien
Mache Podcasts In 5 Minuten zu... Podcast Podcast-Wissen Podcasting-FAQ Podcaster Podcast-Hosting Podcast-Studio Berlin
Erlebe Podcasts Gezielt - Der Reichweiten-Podcast Podcast-Events Podcast-Jobs

Episode 103 - Speed Up Inference - Speculative Decoding

30 Minuten

20.79 MB

Podcast

Podcaster

Knowledge Science - Alles über KI, ML und NLP

Wissenschaft , Bildung , Technologie

Beschreibung

vor 11 Monaten

Send us a text

In der heutigen Sendung sprechen wir über Speculative Decoding,
eine Methode, mit der die Inferenzzeit um den Faktor 2 - 2,4x
beschleunigt werden kann. Wie das Verfahren funktioniert und
welche Möglichkeiten es schafft, erfahren Sie in dieser Sendung.
Bleiben Sie dran.

Vielen Dank auch an unseren Sponsor XL2:

XL2 ist ein Joint Venture von Audi und Capgemini,
dass die digitale Transformation in der Automobilindustrie
vorantreibt. Das Unternehmen erarbeitet innovative
End-to-End-Prozesse und implementiert maßgeschneiderte
IT-Lösungen für seine Kunden.

Support the show