Google Data Cloud Summit – Recap

Google’s Data Cloud Summit took place May 26th, 18PT. The summit is home to their big data products and offerings, that aim to help customers succeed in data driven businesses. Here is a summary of news and announcements:

  • Dataplex, an intelligent data fabric. The product allows management of data across multiple sources, including data lakes, data warehouses and data marts for the goal of centralizing management and governance. From there, Dataplex allows to make data available for analytics and data science.
  • Datastream, a server-less change data capture (CDC) and replication service. The service allows to syncronize datasets across multiple systems by transferring changes alone, thus reducing the amount of data transferred and increasing performance and reliability.
  • Announcement of Analytics Hub, a fully-managed service built on BigQuery. The service aims to provide an open ecosystem for sharing and exchanging data across organisations at scale. Part of the offering will be controls and monitoring over data usage and sharing. The hub will offer self service and monetization for data owners, while reducing the need to operate infrastructure for data owners.
  • Dataflow Prime, a no-ops, serverless data processing platform. Dataflow Prime is a managed offering of Apache Beam based data processing pipelines. The product will autoscale infrastructure.
  • Cloud Spanner will allow more flexible and granular instance sizing
  • Key Visualizer, an interactive monitoring tool to analyze usage patterns in Cloud Spanner
  • Cloud Bigtable lifts SLA to 99.999% and introduces new security features. Security features are namely customer managed encryption keys (Googles acronym CMEK) and audit logs. Alongside with SLAs, the product now aims at compliance with regulated industries.
  • Sessions are available on demand
Google Data Cloud Summit

Join us to learn how leading companies are powering innovation with our data solutions. Attend sessions, demos, and live Q&As to discover how data can help you make smarter business decisions and solve your organization’s most complex challenges.

Google Data Cloud Summit

Source: Home – Data Cloud Summit

Aus verschiedenen Gründen gab es die Notwendigkeit den Unterbau dieses Blogs anzufassen. Heute Vormittag wurde die docker-basierte Installation vom Admin der Seite abgelöst und in dem Zu zu einem anderen Anbieter umgezogen.

Einer der Gründe war, dass es Probleme mit docker-machine, das nicht weiter in der Lage war, abgelaufene Certifikate auf dem Stack zu erneuern. Ein Management der Maschine war daher nicht mehr einwandfrei möglich und Backups scheiterten.

Darüber hinaus waren in dem Stack mehrere Blogs untergebracht, die nicht schön voneinander getrennt waren.

In der Google Clout Platform laufen nun eine Virtuelle Maschine, basierend auf Debian 10 (Buster), mit nginx, php-7.3 und allen für WordPress notwendigen Plugins. Das WordPress kommt nicht aus Debian sondern wurde als komplettes Verzeichnis von den alten Installationen übernommen.

Datenbank Inhalte wurden aus dem container

docker exec -it blogs_database_1 /bin/bash

mysqldump –add-drop-table -u root -p wordpress > wordpress.backup.sql

mysql -h <hostname> -u <username> -p <database> < database.backup.sql

export & import der WordPress Datenbank

Google Cloud Platform bietet automatische Backups sowohl der Server als auch der Datenbank an.

Das SSL/TLS, das vorab von Traefik.io terminiert wurde, übernimmt nun nginx selbst. Die Configuration davon ist mittels certbot erstellt worden, der Zertifikate automatisch von Let’s Encrypt bezieht.

Docker dagegen findet in dem Setup keine Anwendung mehr.