Direkt zum Inhalt
Strategie
14/03/2019

Die Grundvoraussetzung für Industrie 4.0

KI-Projekte benötigen eine Lambda Architektur
Dr. Christoph Gericke
Dr. Christoph Gericke
Teamleiter Data Science, HARTING IT Services
Lambda Architektur

Es gibt derzeit einige Hype-Themen, die in der Öffentlichkeit große Beachtung finden. Eines davon die Grundvoraussetzung für die smarte Fabrik in der Welt von Industrie 4.0, nämlich die künstliche Intelligenz. Und wann immer davon die Rede ist, ist auch das Thema „Big Data“ nicht weit. Denn ein Großteil der populären Machine Learning Methoden basieren auf „Big Data“, um anhand von Beispieldaten zu lernen.

Das maschinelle Lernen oder auch neudeutsch „Machine Learning“ zählt heute zu den gefragtesten Ansätzen der KI, wenn es um die Transformation von Daten in Mehrwert geht. Insbesondere die fertigende Industrie, Maschinenbauer und die Unternehmen, die bereits auf die vernetzte Produktion umgestellt haben, stellen ein exponentielles Wachstum der Datenmenge fest, welches auch auf bislang nicht absehbare Zeit anhalten wird. Daher steigt auch seit einiger Zeit die Nachfrage nach „Machine Learning“-Methoden, die die Unternehmen in die Lage versetzen sollen, mehr als nur einen Bruchteil der Daten in Mehrwert zu verwandeln.

Zu Beginn muss man sich mit dem Thema „Big Data“ auseinandersetzen. Doch wofür steht dieser Begriff konkret? Am besten lässt sich dies anhand der 5 „V“ erklären, welche auf einen Artikel aus dem Jahre 2001 zurückgehen, der mittlerweile auf unterschiedliche Weise ergänzt wurde. Sie stehen für:

  1. Volume: Datenmengen, die so groß sind, dass sie mit traditionellen Methoden nicht mehr effizient gespeichert oder verarbeitet werden können.
  2. Variety: Die Vielfalt der Datenquellen, aber auch Datentypen, die häufig un- oder nur semistrukturiert vorliegen.
  3. Velocity: Die Geschwindigkeit, mit der Daten anfallen, aber auch ausgewertet werden können und müssen.
  4. Veracity: Die Tatsache, dass Daten fehlerbehaftet sind, aber aufgrund der großen Datenmengen auch sein können, ohne in der Summe ihren Wert zu verlieren.
  5. Value: Die Fähigkeit, mit großen Datenmengen nicht nur Kosten, sondern auch einen unternehmerischen Mehrwerkt zu schaffen.

 

Team aus Data-Scientists und -Engineers

Der Schlüssel, um den „Value“ mit den Daten zu schaffen, stellt häufig die Künstlicher Intelligenz dar, da diese komplexen und effizienzsteigernden Automatisierungslösungen im Produktions-, aber auch im Office-Umfeld ermöglicht. Um dorthin zu gelangen ist es jedoch unerlässlich, eine Infrastruktur zu schaffen, die die anderen „V“ adressiert. Die HARTING Technologiegruppe hat aus diesem Grund ein Team aus Data Scientists und Data Engineers gegründet. Dieses Team hat eine, auf der so genannten Lambda-Architektur basierende Infrastruktur implementiert und betreibt diese auch für die Durchführung von KI-Projekten.

MICA® als Teil der Lambda Architektur

Neben den für eine Lambda Architektur typischen Kernelementen eines „kalten“ Pfades zur zyklischen Aufbereitung und eines „heißen“ Pfades zur Analyse von Echtzeitinformationen umfasst die Infrastruktur Elemente, die auf den HARTING Anwendungsfall – ein Industrial IoT Ansatz, bei dem IoT Geräte in der Fertigung installiert sind und dem Kunden Daten auch aus der Infrastruktur heraus zur Verfügung gestellt werden sollen – ergänzt wurden.

Diese sind unter anderem ein System zur Anbindung unterschiedlichster Datenquellen verschiedener IT Systeme, eine Lösung zur Integration von IIoT Geräten, aber auch eine Schnittstelle zur sicheren Bereitstellung und Verrechnung von Informationen an Kunden und Partner. Selbstverständlich ist auch die MICA® als unser Produkt ein Teil der Architektur. Sie hilft uns, als IIoT Gerät einerseits zu großen und vielfältigen Datenmengen zu kommen, die wir zum KI Training brauchen, andererseits aber auch mittels trainierter KI-Systeme das Thema Velocity durch eine Vorverarbeitung am Edge sowie das Thema Variety durch standardisierte Schnittstellen und Datenüberprüfung handhabbar zu machen.

Lambda Architektur

Die Lambda Architektur beschreibt aus konzeptioneller Sicht den Aufbau einer Big-Data-Architektur. Der Name kommt vermutlich aufgrund der Ähnlichkeit zu einem nach links gedrehten „Lambda“ oder ist auf das Lambda-Kalkül zurückzuführen, der Grundlage funktionaler Programmierung. Die Architektur besteht aus zwei Kernkomponenten, dem Speed Layer und dem Batch Layer. Beiden Layern ist in der Regel ein Data Ingestion Layer vorgeschaltet, der für das Puffern und die kurzfristige Wiederherstellbarkeit der Daten zuständig ist. Damit die Daten aus den Verarbeitungslayern angezeigt werden können, verfügen sie über einen Serving Layer, welcher die Daten aufbereitet und bereithält. Erreichen die von einem Sensor erzeugten Daten den Ingestion Layer, werden diese sowohl an den Speed Layer als auch an den Batch Layer weitergegeben. Der Speed Layer verarbeitet die Daten meist direkt und komplett. Dagegen verarbeitet der Batch Layer die Daten meist zeitversetzt in vorgegebenen Intervallen.

Wichtigsten Machine Learning Methoden

Alle Machine Learning Methoden lassen sich in eine zwei Klassen subsummieren: Supervised Machine Learning und Unsupervised Machine Learning. Der wesentliche Unterschied besteht im Lernvorgang. Beim „Supervised Machine Learning“ sind zu Beginn des Lernvorgangs Output Data Sets vorhanden. Diese beinhalten schon valide Ergebnisse, die meist auf Berechnungen basieren und genutzt werden, um den Algorithmus zu trainieren, und ihn anschließend auf andere Daten anzuwenden. Beim „Unsupervised Machine Learning“ ist der erwartete Output am Anfang des Lernvorgangs nicht bekannt. Dieser ergebnisoffene Ansatz ist also explorativer Natur. Der Lernvorgang erfolgt dadurch, dass der Algorithmus versucht, Daten in einer bestimmten Art und Weise zu clustern oder Anomalien zu identifizieren.

Artikel weiterempfehlen

Eingeschränktes HTML

  • Zulässige HTML-Tags: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd> <h2 id> <h3 id> <h4 id> <h5 id> <h6 id>
  • HTML - Zeilenumbrüche und Absätze werden automatisch erzeugt.
  • Website- und E-Mail-Adressen werden automatisch in Links umgewandelt.