#33 Postgres als DWH
1 Stunde 25 Minuten
Podcast
Podcaster
Entwicklern und Nerds spannende und innovativen Technologien näher bringen - das ist das Ziel von Techtiefen. In jeder Folge wird ein Thema in einem intensiven Gespräche mit wechselnden Experten und Expertinnen ausführlich erklärt. Dabei haben wir den...
Beschreibung
vor 3 Jahren
PostgreSQL (Postgres) gilt als die fortschrittlichste und
mächtigste Open Source Datenbank. Dank breiter Unterstützung des
SQL-Standards, langjähriger Stabilität und einer großen Community
ist sie heute häufig die erste Wahl zur Speicherung tabellarischer
Daten. Hans-Jürgen Schönig arbeitet seit über 20 Jahren als
Postgres Consultant und beschreibt im Podcast, wo die Stärken der
relationalen Datenbank liegen und wie Transaktionssicherheit für
DDLs das Handling großer Systeme erleichtert. Zudem erklärt er,
wieso man Performance-Bottlenecks nicht in Load-Graphen sondern in
den Abfragen selbst suchen soll und gibt Tipps um die
Ausführungszeiten jener zu reduzieren. Anders als analytische
Datenbanken oder etwa Apache Parquet (Folge 31) ist Postgres
zeilenorientiert. Dank der Erweiterung Postgres in vielerlei
Hinsicht zu erweitern, bietet sich dennoch die Möglichkeit Postgres
auch für analytische Workloads wie etwa im DWH-Umfeld einzusetzen.
Thomas Richter hat hierfür (Swarm64) gegründet, ein Startup das
Postgres um einen Columnstore Index erweitert und mit zusätzlichen
Statistiken und Operatoren die Planung und Ausführungszeit von
Abfragen reduziert. Thomas gibt im Podcast hierfür Einblicke wie
Postgres Abfragen parallel ausführt ohne Konsistenz-Garantien zu
verletzen. Abschließend vergleichen wir gemeinsam die Performance
von Postgres mit kommerziellen Konkurrenzprodukten und open source
Alternativen wie Greenplum.
mächtigste Open Source Datenbank. Dank breiter Unterstützung des
SQL-Standards, langjähriger Stabilität und einer großen Community
ist sie heute häufig die erste Wahl zur Speicherung tabellarischer
Daten. Hans-Jürgen Schönig arbeitet seit über 20 Jahren als
Postgres Consultant und beschreibt im Podcast, wo die Stärken der
relationalen Datenbank liegen und wie Transaktionssicherheit für
DDLs das Handling großer Systeme erleichtert. Zudem erklärt er,
wieso man Performance-Bottlenecks nicht in Load-Graphen sondern in
den Abfragen selbst suchen soll und gibt Tipps um die
Ausführungszeiten jener zu reduzieren. Anders als analytische
Datenbanken oder etwa Apache Parquet (Folge 31) ist Postgres
zeilenorientiert. Dank der Erweiterung Postgres in vielerlei
Hinsicht zu erweitern, bietet sich dennoch die Möglichkeit Postgres
auch für analytische Workloads wie etwa im DWH-Umfeld einzusetzen.
Thomas Richter hat hierfür (Swarm64) gegründet, ein Startup das
Postgres um einen Columnstore Index erweitert und mit zusätzlichen
Statistiken und Operatoren die Planung und Ausführungszeit von
Abfragen reduziert. Thomas gibt im Podcast hierfür Einblicke wie
Postgres Abfragen parallel ausführt ohne Konsistenz-Garantien zu
verletzen. Abschließend vergleichen wir gemeinsam die Performance
von Postgres mit kommerziellen Konkurrenzprodukten und open source
Alternativen wie Greenplum.
Weitere Episoden
1 Stunde 38 Minuten
vor 6 Monaten
1 Stunde 14 Minuten
vor 7 Monaten
50 Minuten
vor 9 Monaten
2 Stunden 32 Minuten
vor 1 Jahr
1 Stunde 8 Minuten
vor 1 Jahr
In Podcasts werben
Abonnenten
Berlin
Kommentare (0)