predigt.io

predigt.io ↗
KI-Plattform NATS Messaging Microservices Kubernetes Eigenes Produkt

predigt.io ist eine vollständig selbst entwickelte SaaS-Plattform für deutschsprachige Gemeinden — von der Produktidee bis zum produktiven Betrieb in Alleinverantwortung realisiert. Die Plattform transkribiert, übersetzt und analysiert Predigten automatisiert in elf Sprachen und macht sie semantisch durchsuchbar.

Im Kern steht eine KI-Pipeline aus drei Transkriptions-Engines: AssemblyAI für Express-Ergebnisse, OpenAI Whisper auf dedizierter GPU für maximale Präzision und Claude (Anthropic) für Zusammenfassungen, Kapitelmarken und kontextuelle Auswertungen. Alle drei Engines laufen parallel und werden cost-aware geroutet.

Die Kommunikation zwischen elf eigenständigen Microservices erfolgt ausschließlich über NATS JetStream — mit Object Store für den Audio-Transport, KV Store für verteilten Pipeline-State und strikt typisierten Protobuf-Schemas als Service-Vertrag. Kein synchroner RPC, keine direkte Service-zu-Service-Abhängigkeit.

Der Betrieb läuft auf einem selbst aufgebauten Hetzner-Kubernetes-Cluster mit vollständigem Observability-Stack, GitLab CI/CD und Helm-basierten Deployments.

11Microservices
4Sprachen (Go · Java · Python · TS)
3LLM-Provider
11Übersetzungssprachen
NATS JetStreamProtobufKubernetesHelmGoJava 21PythonTypeScriptClaudeAssemblyAIWhisper GPUPostgreSQLMongoDBGitLab CI/CDPrometheusLokiGrafana
arc42 · Bausteinsicht (Level 1)
CLIENTS Web App React / Vite Mobile App React Native Firebase Auth Google + Microsoft OAuth QUICKSCRIPT BACKEND (Go · Gin) HTTP Handlers REST + WebSocket Auth Middleware JWT Verify Services Download · AI · FCM Repository PostgreSQL NATS Service JetStream · Notify · GPU Dispatch · Worker Coord Worker Health Monitor (Sermo-Captum) NATS JETSTREAM sermo-captum-js audio fetch pipeline gpu-transcription-js Whisper dispatch notify-js notify.user.{hash}.* Object Store Audio 15 GB · GPU 10 GB (4h TTL) KV Store Pipeline-State · Config-Watcher WORKER FLEET Sermo-Captum Workers Go · yt-dlp · DataImpulse / NordVPN Whisper GPU Worker Python · FastAPI · CUDA · large-v3 WisdomNet Go · Multi-LLM · MongoDB KI-SERVICES Claude (Anthropic) Zusammenfassung · Kapitel · Übersetzung AssemblyAI Express-Transkription Whisper large-v3 GPU · OpenAI · Präzisions-Transkription ChatGPT · Gemini (Fallback) INFRASTRUKTUR Kubernetes (Hetzner Cloud) Helm · Ingress · cert-manager GitLab CI/CD + Watchtower Auto-Deploy · Image Registry Prometheus · Loki · Grafana DATENSPEICHER PostgreSQL 16 Nutzer · Jobs Transkriptionen MongoDB KI-Antworten Dokumente Protobuf-Schemas nats-schemas Repo · Go · Java · Python Stubs HTTP/WSS publish HTTPS NATS Legende Backend-System Messaging (NATS) KI-Services Worker Fleet synchroner Aufruf (HTTP/gRPC) asynchron (NATS publish) Datenzugriff

Zielkommunikationsarchitektur · Kritische Infrastruktur

Regulierter Energieversorger · Kritische Infrastruktur · Deutschland
KRITIS arc42 Hochverfügbarkeit IT-Architektur

Für einen großen Betreiber kritischer Energieinfrastruktur wurde gemeinsam mit mehreren Partnerunternehmen eine Zielkommunikationsarchitektur für zeitkritische Regelenergieprozesse erarbeitet. Das Projekt unterliegt der BSI-KRITIS-Verordnung — jeder Kommunikationsweg muss eine Verfügbarkeit von 99,96 % über die gesamte Prozesskette nachweisen.

Kern der Aufgabe war die systematische Analyse bestehender Kommunikationswege zwischen europäischen Marktplattformen und den Backend-Systemen des Betreibers, die Bewertung von Alternativen sowie die Erarbeitung eines konsolidierten Architekturvorschlags nach arc42 — entscheidungsreif für die zuständigen Fach- und IT-Gremien.

Die Herleitung berücksichtigte prozessuale Rahmenbedingungen zeitkritischer Regelenergieprozesse, finanzielle und zeitliche Bewertung aller Varianten sowie Szenarien für eine mögliche Cloud-Migration zentraler Systemkomponenten.

mehrerePartnerunternehmen
99,96 %SLA-Anforderung
arc42Dokumentationsstandard
arc42KRITISBSIIT-SecuritySFTPMFTHochverfügbarkeitRedundanzkonzepteIT-ArchitekturCloud-MigrationCompliance
arc42 · Kontextabgrenzung
BETREIBER-BACKEND Abrufsystem · Sync-Adapter Abruf · Plausibilisierung · Bestätigung Versionsverwaltung · Protokollierung ZIELARCHITEKTUR (Ergebnis) 99,96 % SLA · Redundanz · BSI-KRITIS MARKTPLATTFORMEN Europäische Regelbörsen Ausschreibungs-Clearing Zeitfenster-Vorgaben Merit-Order-Auskopplung PARTNERUNTERNEHMEN Weitere Netzbetreiber D-A-CH + Benelux Unternehmensübergreifend KOM-INFRASTRUKTUR Standardprotokolle MFT · SFTP Redundante Pfade ENTSCHEIDUNG Fach- und IT-Gremien Freigabe-Komitee arc42-Dokumentation COMPLIANCE BSI-KRITIS-VO ISMS-Prozess IT-Security-Anforderungen CLOUD-OPTION Cloud-Migration Kernsystem Bewertung (qualitativ) Zeitlich · Ressourcen Regelsignale Koordination Transportweg Architekturvorschlag KRITIS-Nachweis Optionsbewertung Verfügbarkeitsanforderung: 99,96 % über die gesamte Prozesskette je Produktart

Kafka Integration Layer · Core Banking

Kantonalbank · Finanzsektor · Schweiz
Apache Kafka Microservices OpenShift Core Banking

Zur Erweiterung einer Core-Banking-Plattform (Avaloq) wurde ein Kafka-basierter Integration Layer konzipiert und implementiert. Ziel war die Entkopplung der gewachsenen Monolith-Schnittstellen durch ein zuverlässiges, skalierbares Event-Streaming-Backbone — ohne den laufenden Bankbetrieb zu unterbrechen.

Spring-Boot-Microservices auf OpenShift-Basis übernehmen die fachliche Verarbeitung. Die Anbindung des Avaloq-Kernsystems, Readiness-Probes, Default-Timeout-Analyse und Performance-Messungen unter Last waren ebenso Teil der Aufgabe wie die Beratung der Teams zu Kafka-Konzepten: Partitionsauslegung, Eventstruktur und -versionierung, linger.ms/batch.size-Tuning und Cluster-Failover.

Für mobile Apps (Zak) wurden REST-Interfaces designed und implementiert. Ein ELK-Stack ermöglicht End-to-End-Latenzauswertungen über die gesamte Kafka-Pipeline.

AvaloqCore-Banking-System
OpenShiftContainer-Plattform
ELKObservability
Apache KafkaSpring BootOpenShiftKubernetesGoElasticsearchLogstashKibanaPrometheusJenkinsRESTPostgreSQLAvaloqScrum
arc42 · Bausteinsicht (Level 1) — Kafka Integration Layer
AVALOQ Core Banking Kredit · Portfolio Buchung · Compliance Default Timeout Analyse & Tuning KAFKA INTEGRATION LAYER Apache Kafka Cluster Broker 1–3 Replikation ZooKeeper Cluster-Koordination Topics · Partitionen · Retention linger.ms / batch.size Tuning Microservices (Spring Boot) Integration Svc Avaloq Adapter Kredit-Svc Kreditberatung Mobile API REST · Zak App Base Svc Readiness-Probe OpenShift Cluster Jenkins CI · Helm · Prometheus Readiness + Liveness Probes OBSERVABILITY ELK Stack Elasticsearch · Logstash · Kibana Prometheus + Grafana Kafka Metriken · Service Health End-to-End Latenz Timestamps · Pipeline-Messung Spring Boot Actuator · JMX CONSUMER Fachanwendungen Omnium · Kreditberatung Mobile App Zak REST API · iOS · Android KAFKA BERATUNG Partitionsauslegung Eventstruktur & -versionierung Cluster-Failover Team-Coaching Performance-Tuning Events publish consume REST / Events Metriken Sync·Timeout

Ihr Projekt ist das nächste?