Folge 93: Prof. Björn Ommer und wie wir finden, was noch nicht existiert
#digdeep - Neues aus der digitalen Welt
39 Minuten
Podcast
Podcaster
Beschreibung
vor 2 Jahren
Prof. Björn Ommer leitet nach Stationen in Berkeley, Zürich und
Heidelberg die Computer Vision & Learning Group der LMU
München. Mit seinem neuronalen Netzwerk "stable diffusion" kann er
aus Texten oder Skizzen Bilder erzeugen - so wie eine Websuche, die
das erschafft, wonach wir suchen. Wir sprechen mit Björn über die
methodischen Ansätze und Herausforderungen von solch generativen
Computermodellen wie GPT-3, DALL-E oder Stable Diffusion, die mit
der Erzeugung von Texten und Bildern viele Branchen
revolutionieren. Sie könnten in Zukunft ermöglichen, Inhalte
individuell und ad hoc zu erzeugen: Wie wäre es mit einem Kinofilm,
der sich live an die anpasst, die ihn gerade anschauen? Bereits die
heutigen Modelle sind spielerisches und kreatives Werkzeug für
alle, stoßen aber noch an viele Grenzen - und "verstehen" nicht
wirklich, was sie tun. Und sie werfen Fragen auf, wie mit der
kreativen Leistung der Trainingsdaten, aber auch den vom
Algorithmus erzeugten Bildern umzugehen ist. Björn gibt uns einen
spannenden Einblick in einen Zweig der Digitalisierung, der
exponentiell wächst und unseren Alltag verändern wird.
https://stablediffusionweb.com/#demo
https://ommer-lab.com/people/ommer P.S. Das Beitragsbild wurde
natürlich mit "Stable Diffusion" erzeugt. Was war wohl der Text?
Heidelberg die Computer Vision & Learning Group der LMU
München. Mit seinem neuronalen Netzwerk "stable diffusion" kann er
aus Texten oder Skizzen Bilder erzeugen - so wie eine Websuche, die
das erschafft, wonach wir suchen. Wir sprechen mit Björn über die
methodischen Ansätze und Herausforderungen von solch generativen
Computermodellen wie GPT-3, DALL-E oder Stable Diffusion, die mit
der Erzeugung von Texten und Bildern viele Branchen
revolutionieren. Sie könnten in Zukunft ermöglichen, Inhalte
individuell und ad hoc zu erzeugen: Wie wäre es mit einem Kinofilm,
der sich live an die anpasst, die ihn gerade anschauen? Bereits die
heutigen Modelle sind spielerisches und kreatives Werkzeug für
alle, stoßen aber noch an viele Grenzen - und "verstehen" nicht
wirklich, was sie tun. Und sie werfen Fragen auf, wie mit der
kreativen Leistung der Trainingsdaten, aber auch den vom
Algorithmus erzeugten Bildern umzugehen ist. Björn gibt uns einen
spannenden Einblick in einen Zweig der Digitalisierung, der
exponentiell wächst und unseren Alltag verändern wird.
https://stablediffusionweb.com/#demo
https://ommer-lab.com/people/ommer P.S. Das Beitragsbild wurde
natürlich mit "Stable Diffusion" erzeugt. Was war wohl der Text?
Weitere Episoden
38 Minuten
vor 2 Tagen
14 Minuten
vor 2 Wochen
43 Minuten
vor 3 Wochen
43 Minuten
vor 2 Monaten
37 Minuten
vor 3 Monaten
In Podcasts werben
Kommentare (0)