Machine learning engineering

We bieden machine learning engineering diensten: het ontwikkelen van software voor machine learning applicaties. Deze software omvat robuuste data pipelines, functionaliteit voor het trainen en deployen van het model en voor interactie met de gebruiker. Daarbij ligt onze focus op technisch-wetenschappelijke toepassingen, waarin de data grotendeels uit sensoren komt.

Software voor systemen op basis van machine learning

Voor onze klanten werken we aan software voor het opstellen van verwachtingen, voor analyses en voor het optimaliseren van processen. In de beginjaren van VORtech waren de algoritmen daarin vooral gebaseerd op traditionele wiskunde, zoals numerieke wiskunde, statistiek en optimalisatiemethoden.

Sinds de jaren ’10 is machine learning in opkomst. Daarbij wordt geen expliciet algoritme meer geformuleerd maar wordt het algoritme door de computer gegenereerd op basis van beschikbare data. VORtech is volop in deze ontwikkeling meegegaan. Niet alleen uit interesse maar ook omdat we onze klanten zo goed mogelijk willen bedienen. Want voor bepaalde toepassingen is machine learning krachtiger dan de traditionele aanpak. Daarbij zijn we wel bij onze core-business gebleven: de software.

Machine learning engineering

Grote delen van een machine learning applicatie zijn vergelijkbaar met meer traditionele applicaties waaraan we werken zoals het voorspelsysteem van Rijkswaterstaat. Ook daarin dient een belangrijk deel van de software voor het ophalen en bewerken van data uit externe bronnen, voor de dashboards (zoals de WBViewer) en voor de distributie van resultaten naar andere systemen. Toch is een machine learning applicatie anders dan een traditioneel systeem.

Dat komt met name doordat een machine learning applicatie volledig datagedreven is. Als er op de een of andere manier verkeerde data binnenkomt dan kan dat onvoorspelbare gevolgen hebben. Vaak is eenvoudig te detecteren dat data verkeerd is. Maar soms is dat ook heel subtiel. Als de statistiek van de data verandert dan kan het algoritme heel verkeerde uitkomsten gaan geven terwijl de data in orde lijkt. In zo’n situatie moet het algoritme soms opnieuw getraind worden om overweg te kunnen met de nieuwe statistiek. Het is zaak om tijdig te detecteren dat het algoritme niet meer aansluit bij de binnenkomende gegevens.

VORtech heeft ervaring met het ontwikkelen van machine learning applicaties. Dit staat bekend als machine learning engineering. Daarbij onderscheiden we ons van andere bedrijven door onze ervaring met sensordata en ons begrip van de fysische processen waaruit die sensordata voortkomt. We ontwikkelen we de hele data-pipeline, van het ophalen van data tot de distributie van resultaten, inclusief de voorzieningen voor het trainen en deployen van het algoritme en het monitoren van de kwaliteit.

Onze diensten

Advisering

Machine learning is voor veel klanten nog redelijk onbekend. We krijgen dan ook regelmatig de vraag om te komen uitleggen wat het is en hoe bruikbaar het is. Vanuit onze ervaring op dit gebied denken we graag met u mee. Omdat we een brede achtergrond hebben in wetenschap en technologie kunnen we makkelijk praten met experts uit allerlei toepassingsgebieden.

Als u al een toepassing in gedachten heeft, dan kunnen we u helpen om uit te werken hoe dat gerealiseerd zou kunnen worden.

In de loop der jaren hebben we geleerd dat het van groot belang is om helder te hebben wat men precies wil bereiken en waarom. Zie ook onze blog over het definiëren van waardevolle big data toepassingen voor mensen die pas net met data aan de slag gaan. Vaak blijkt dat de vraag die de klant oorspronkelijk had niet de juiste is. Of in de originele vorm niet beantwoord kan worden. We merken dan ook regelmatig dat onze advisering essentieel is voor het slagen van een project.

Opzetten van een data-pipeline en een user interface

De meeste applicaties waar we aan werken zijn gebaseerd op sensordata. Het opzetten van een data-pipeline begint bij het leren begrijpen van de data. Ook dit vergt weer een intensieve samenwerking met experts en operators bij de klant. Af en toe adviseren we ook bij het plaatsen van extra sensoren als er essentiële informatie ontbreekt.

Sensorgegevens zijn notoir rommelig. Sensoren zijn niet altijd goed gekalibreerd. Verbindingen vallen soms weg. En de systemen waarmee de gegevens ingezameld worden hebben soms hun eigen problemen. Bovendien worden soms grote hoeveelheden data gegenereerd (big data) terwijl maar een fractie daarvan echt nuttig is.

Een belangrijke taak binnen machine learning engineering is om deze ruwe data om te zetten in een betrouwbare en efficiënte datastroom. Dit staat bekend als data engineering. Het omvat het terugbrengen van de gegevens tot de fractie die nuttig is en het detecteren van allerhande fouten en artefacten. In een bijzonder project hebben we algoritmen ontwikkeld die automatisch foutieve sensoren detecteren.

Ook het repareren van fouten of het verwijderen van foutieve gegevens is onderdeel van data engineering. Waar nodig kunnen we schattingen genereren voor ontbrekende data (imputatie). En we kunnen gegevens samenvoegen tot features die voor machine learning bruikbaarder zijn dan de originele data.

We kennen de technieken om data op te halen van externe bronnen, we ontwikkelen efficiënte algoritmen om data om te werken tot features die in het model gebruikt kunnen worden. We hebben ruime ervaring met het ontwikkelen van dashboards op basis van moderne, gangbare software platforms. En we weten hoe we de distributie van resultaten naar andere systemen moeten regelen.

Het algoritme zelf

VORtech beschouwt zich niet als expert op het gebied van machine learning algoritmen, maar we hebben voldoende ervaring om de eenvoudige machine learning methoden toe te passen. Daarmee kan dan een proof-of-concept gemaakt worden. Vaak is dat al heel waardevol of zelfs voldoende. Daar waar het nodig is om echt het onderste uit de kan te halen van een bepaalde machine learning techniek zullen we niet aarzelen om een specialist van buiten VORtech in te schakelen. We weten tot hoever onze kennis reikt.

Als het mogelijk is, kiezen we altijd voor een machine learning techniek die eenvoudig te begrijpen is. Dat helpt niet alleen om het algoritme te laten accepteren door de operators, maar geeft ook de inzicht in de betrouwbaarheid ervan.

Als er al een machine learning algoritme ontwikkeld is, bijvoorbeeld door een data-scientist van de klant, dan kunnen we dat omzetten in productie-waardige programmatuur. We zorger ervoor dat de juiste mechanismen ingebouwd worden om tijdig te detecteren dat een algoritme niet meer goed functioneert.

We vinden het belangrijk dat de klant zelf inzicht heeft in hoe de applicatie werkt om te voorkomen dat men de uitkomsten van de applicatie verkeerd interpreteert. Daarom zullen we het door ons ontwikkelde systeem dan ook altijd overdragen aan werknemers bij de klant en ze helpen om het te onderhouden en door te ontwikkelen. Mocht onze hulp daarbij nog gewenst zijn, dan staan we uiteraard wel klaar.

Use cases voor machine learning in de technische sector

Ter inspiratie volgen hier een paar bekende voorbeelden van systemen op basis van machine learning.

  • Procesoptimalisatie
    Machine learning kan helpen om processen te optimaliseren. Bijvoorbeeld door voorspellingen te maken waarmee de operators het proces kunnen bijsturen. Het opstellen van voorspellingen met machine learning gaat meestal veel sneller dan met traditionele voorspellingsmethoden.
  • Ondersteuning van Operators
    Machine learning kan helpen om snel afwijkingen in de bedrijfsprocessen te detecteren en daarbij gericht informatie te geven aan de operators. Voor Vitens werkten we aan algoritmen om snel het optreden van lekkages in het leidingenstelsel te detecteren en aan te wijzen waar het lek vermoedelijk zit. Daardoor kunnen monteurs snel en gericht het lek vinden en herstellen, nog voordat de overlast serieus wordt.
  • Voorspellend Onderhoud
    Op grond van machine learning kan bepaald worden hoe lang een asset nog zonder problemen verder kan. Een uitdaging daarbij is dat er vaak weinig data over storingen is omdat men die zoveel mogelijk probeert te voorkomen. Er moet dan ook gekeken worden naar trends in de data die een indicatie vormen van naderende problemen.
  • Kwaliteitscontrole
    Computer vision is een standaard techniek geworden om artefacten in producten te detecteren. De computer kan vaak beter en sneller herkennen dat er een fout in een product zit dan dat mensen dat kunnen. En het is nog goedkoper ook. Er zijn bedrijven die gespecialiseerd zijn in computer vision. VORtech zal u graag doorverwijzen.

Bent u geïnteresseerd?

VORtech opereert aan het front van technologie voor voorspellingen en analyses. Machine learning is een belangrijke aanvulling op de gereedschappen uit de wiskunde en IT die we al meer dan 20 jaar inzetten. Als het bovenstaande voor u interessant is, neem dan contact op. We komen graag een keer langs om de mogelijkheden van deze technologie te bespreken.

Bent u geinteresseerd?
Neem contact met ons op voor een vrijblijvend kennismakingsgesprek
Neem contact op