Computer Vision für Software Roboter

Computer Vision für Software Roboter

Künstliche Intelligenz ist in aller Munde. Jedes Gerät mit Bluetooth ist smart und alles was in Python geschrieben ist scheint sofort eine künstliche Intelligenz zu haben. Ist das die Ansicht eines Zynikers oder die eines Realisten? Schauen wir uns an, wie Computer Vision als Element des KI Baukastens für intelligente RPA genutzt werden kann.

Computer Vision

Robotic Process Automation arbeitet mit und auf den Bildschirmen von Menschen. Maschinelles Lernen arbeitet in der Regel auf großen Datenmengen. Die offensichtliche Datenquelle für Software Roboter sind demnach Bilder, die es zu verarbeiten gilt. Was also, wenn ein Software Roboter sehen könnte, was wir auch sehen. Der Forschungszweig, der sich mit diesem Thema beschäftigt nennt sich maschinelles Sehen. Wikipedia definiert dieses wie folgt:

Der Begriff Maschinelles Sehen oder Bildverstehen beschreibt im Allgemeinen die computergestützte Lösung von Aufgabenstellungen, die sich an den Fähigkeiten des menschlichen visuellen Systems orientieren.

Die Anwendungsgebiete dieser Bilderkennung sind vielschichtig. Von der einfachen Mustererkennung bis hin zur Verkehrszeichenerkennung im Auto reicht die Bilderkennung bereits in viele bekannte und alltägliche Bereiche – Gestenerkennung, Medizintechnik, Objekterkennung im Lager, Zeichen- und Stifterkennung. In vielen Fällen merken wir gar nicht, dass maschinelles Sehen im Einsatz ist.

Mit UIPath besteht die Möglichkeit, diese Computer Vision in Software Roboter zu integrieren und diese Technologie somit für die Automatisierung Ihrer Prozesse zu verwenden.

AI Computer Vision for RPA

Im Grunde soll Computer Vision einem Roboter bzw. seinem Entwickler die Möglichkeit geben, sich von Selektoren zu lösen. Selektoren identifizieren Elemente auf dem Desktop, damit der Roboter in der Lage ist, die entsprechenden Elemente ausfindig zu machen. Kann sich der Roboter von diesen Selektoren lösen, lassen sich auch Elemente identifizieren, die üblicherweise nicht verwendbar sind; so z.B. in Virtual Desktop Interfaces wie Citrix, VMWare oder Microsoft RDP. Aber auch Fenster von Tools wie Flash oder Silverlight können so durch Roboter erkannt werden.

Roboter, die sehen

Wie gut das maschinelles Sehen uns in Zukunft unterstützen kann wird sich in den nächsten Jahren definitiv noch zeigen. Sicher ist: Es ist der nächste große Schritt nach der einfachen OCR. In wie weit sich das praktisch bewähren wird, werden wir in den nächsten Artikeln berichten.

Haben Sie schon Erfahrungen mit maschinellem Sehen? Teilen Sie gerne Ihre Erfahrungen mit uns!