MLOps: Hightech made in Lingen

MLOps bei einem führenden Technologieunternehmen

MLOps: Hightech made in Lingen

Einführung einer unternehmensweiten Self-Service ML-Plattform

Die viadee unterstützte die ROSEN Gruppe bei der Bereitstellung der Plattform auf der hauseigenen OpenShift-Container-Plattform, bei der Einbindung der benötigten Ressourcen inklusive Customizing, bei Schulungen und Wissenstransfer im Unternehmen sowie bei der Etablierung eines Lebenszyklus-Modells für ML-Modelle unterstützt durch Kubeflow.

Ihr Ansprechpartner:
Tobias Goerke
Logo der ROSEN Gruppe

Die ROSEN Gruppe

Die Schweizer ROSEN Gruppe nutzt modernste Technologien, um kleinste Risse und Korrosionsschäden in Öl- und Gasleitungen sowie diversen anderen industriellen Anlagen und Strukturen zu erkennen. Gemäß dem Leitmotiv "Spitzentechnologien zum Schutz von Mensch und Umwelt" können Kunden des Pipeline-Inspektions-Weltmarktführers somit seit 1981 ihre Infrastrukturen prädiktiv untersuchen lassen.

Die Grundlage des Geschäftsmodells bildet das Sammeln und Auswerten von Daten mittels autonomer Inspektions- und Messtechnik, die das Unternehmen selbst an seinen weltweiten Standorten entwickelt, herstellt und auch selbst einsetzt.

So konnte das Unternehmen in mehr als 40 Jahren über zwei Millionen Pipeline-Kilometer weltweit hochauflösend abtasten und inspizieren. Die ROSEN Gruppe geht aber noch einen Schritt weiter und verkauft die Rohdaten nicht einfach an die Auftraggeber wie Infrastrukturbetreiber. Die Daten werden von den Datenspezialisten in Lingen auch ausgewertet, analysiert und interpretiert. Mit dieser Strategie stellt der Markt- und Technologieführer in diesem Sektor die datengetriebene Entscheidungsunterstützung und -findung in den Mittelpunkt.

Herausforderung: Die Magie in den Daten sinnvoll nutzen

Bereits früh erkannte die ROSEN Gruppe die Tragweite von künstlicher Intelligenz (KI) und maschinellem Lernen (ML) im Umgang mit den enormen Datenmengen. Moderne Methoden erkennen zum Beispiel automatisiert Muster, Abweichungen und Anomalien, wodurch diese den menschlichen Entscheidungsprozess optimieren können.

Um diesen technologischen Wandel effizient zu nutzen, wurden zunächst organisatorische Änderungen eingeführt. Data-Science-, Entwicklungs- und Produktions-Teams wurden zusammengeführt, um Kommunikationsprobleme und Silobildung zu vermeiden. Dazu wurde die IT-Infrastruktur angepasst und erweitert, um den erhöhten Bedarf an Rechenleistung zu decken. Ein Ziel war zum Beispiel, die Auslastung von kostenintensiven Grafikkarten zu erhöhen. Ein weiteres war es, standardisierte ML-Tools mit klaren Standards zu definieren und auszurollen, wodurch die Kollaboration im Team verbessert und die Modellentwicklung beschleunigt werden sollte.

Die Zusammenarbeit mit der viadee Unternehmensberatung: Die ROSEN ML Plattform

Um die Herausforderungen zu bewältigen, entschied sich die ROSEN Gruppe, die ML-Plattform auf der Grundlage von Kubeflow einzuführen.
In enger Zusammenarbeit mit dem Kompetenzbereich Data & AI der viadee IT-Unternehmensberatung wurden

  • die Plattform auf der hauseigenen OpenShift-Container-Plattform bereitgestellt,

  • benötigte Ressourcen eingebunden und ein Customizing durchgeführt,

  • MLOps-Schulungen und Wissenstransfer im Projektbetrieb geleistet,

  • sowie ein Lebenszyklus-Modell für ML-Modelle etabliert und durch Kubeflow unterstützt.

Das Ergebnis

Es ist ein Self-Service-Modell entstanden, das den Data Scientists der ROSEN Gruppe leistungsfähige Ressourcen wie GPUs im Cloud-Native-Modus zur Verfügung stellt und die Verwendung vereinheitlichter Tools und Standards in geprüften Linux-Umgebungen ermöglicht. Dies führte zu einer höheren Automatisierung und effizienteren Prozessen in den frühen Phasen der Algorithmenentwicklung. Die Vorteile von Kubeflow erstrecken sich über das experimentelle Arbeiten hinaus: Es ermöglicht und fördert die Bereitstellung von ausgereiften ML-Workflows und die Einführung von CI/CD-Prozessen für KI. So kann ein neues ML-Modell vollautomatisiert in die Produktion entlassen werden, sobald neue Daten für das Machine Learning verwendet worden sind. Kubeflow trägt damit zur organisatorischen und technischen Skalierung von Machine Learning bei.

Kubeflow wurde darüber hinaus nahtlos in die bestehende Entwicklungslandschaft der ROSEN Gruppe integriert, wodurch Anbindungen an Git, Azure DevOps und Artifactory möglich wurden. Besonders nützlich für die Teams war die Verfügbarkeit einer beträchtlichen Anzahl von A100-GPUs, die die Trainingsprozesse erheblich beschleunigten. Die positiven Erfahrungen der Data Scientists mit der Plattform lassen sich auf mehrere Faktoren zurückführen, darunter spezifische Unterstützung durch das Plattform-Team, ausführliche Dokumentationen und gemeinsame Standards. Auf dieser Basis konnte die Plattform zügig einen Sog-Effekt entwickeln und schnell aus der Pilotphase herauswachsen. 

Neben den vielen Erfolgen gab es unterwegs auch Herausforderungen zu bewältigen. Das schnelle, internationale Wachstum der Plattform, sowie der Mangel an Fachkräften mit Kenntnissen in Kubernetes und Machine Learning waren anfängliche Hürden. Vor der Beendigung der Pilotphase musste die Infrastruktur an die Anforderungen der ROSEN Gruppe angepasst werden. So erforderte die Anforderung an die Resilienz der Infrastruktur, die Instandhaltung der Plattform und die Umsetzung von Sicherheitsmaßnahmen eine erhöhte Aufmerksamkeit. Hilfreich war dabei das deutliche Commitment zur Open-Source-Strategie des Kubeflow-Projektes. Zudem gestaltete sich die Integration unterschiedlicher Datenquellen komplex. Hier liegt eine wichtige und deutliche Systemgrenze: Kubeflow setzt alle Aspekte der Datenhaltung und des Daten-Managements voraus und erwartet sie in externen Systemen. Es hat keinen „Alleinherrschaftsanspruch“ über andere Elemente der Daten-Wertschöpfung, wie er bei anderen, stark integrierten (Cloud-) Plattformen (besonders für tabellarische Daten) deutlich erkennbar ist. Für ROSEN war diese Systemgrenze aber genau richtig gezogen und der Fokus konnte auf dem MLOps-Aspekt liegen.

Fazit und Ausblick

Wir beglückwünschen die Kolleg:innen der ROSEN Gruppe zu ihrem beeindruckenden Erfolg bei der Einführung einer wegweisenden unternehmensweiten ML-Plattform. Diese innovative Initiative hat nicht nur zu einer Optimierung der Data-Science-Projekte geführt, sondern auch die Gesamteffizienz erheblich gesteigert und die Nutzung von Daten auf ein neues Level gehoben.

In Zukunft soll, in Zusammenarbeit mit dem BPM-Team der viadee IT-Unternehmensberatung, die Integration mit den überspannenden Geschäftsprozessen gestärkt werden: Denn aus den Daten zu lernen, Entscheidungsmodelle anzuwenden, ist für die ROSEN keine Digitalisierung am Rande, sondern das Kerngeschäft. Es ist jetzt schon erkennbar, dass auch dieses Vorhaben von der flexiblen Micro-Service-Architektur der Kubeflow-Plattform profitieren wird.

Mit der Implementierung von Kubeflow legt die ROSEN Gruppe eine solide Basis für künftige Data-Science-Initiativen. Dadurch eröffnen sich dem Unternehmen spannende Möglichkeiten, um im Bereich Forschung, Entwicklung und Implementierung von KI-Algorithmen weiterhin branchenführend zu agieren.

Weiterführende Links:

Der viadee Kompetenzbereich Data & AI bietet Ihnen umfangreiche Informationen zu KI-Plattformen und zu den Leistungen und Angeboten der viadee an

KI-Plattformen gemeinsam mit der viadee umsetzen.

In diesem Seminar beleuchten wir typische Probleme und Ansprüche, die Machine-Learning-Projekten vor ihrem Release bevorstehen. Dann zeigen wir, wie MLOps-Techniken und Methoden helfen können den Ansprüchen gerecht zu werden. Hierfür stellen wir insbesondere Googles Cloud-Native ML Plattform „Kubeflow“ vor. Diese hat keinen geringeren Anspruch, als den gesamten ML-Projektlebenszyklus durch skalierbare Workflows zu begleiten, Modell-Deployments zu vereinfachen und somit den professionellen Betrieb von KI-Projekten zu ermöglichen.

Das Seminar kann als Inhouse Seminar in Ihren Räumen oder in einer unserer Geschäftsstellen in Köln, Dortmund oder Münster stattfinden.

Zum Seminar.

Lesen Sie mehr über die Arbeit der viadee. Bei der Provinzial Versicherung haben wir Kubeflow als MLOps-Plattform eingeführt.

Referenzstory: Kubeflow @ Provinzial

Haben wir Ihr Interesse geweckt?

  • Sie stehen vor ähnlichen Herausforderungen?

  • Sie suchen nach einem erfahrenem Partner für die Einführung oder den Betrieb von MLOps?

  • Sie haben Fragen zu MLOps oder Kubeflow?

Dann lassen Sie uns sprechen!

Tobias Goerke