
De impact van Machine Learning op rekensoftware
Een interview met Rob van Nieuwpoort van de Universiteit Leiden
Als je wilt weten welke rol machine learning gaat spelen bij het ontwikkelen van rekensoftware, dan is de groep van professor Rob van Nieuwpoort bij het LIACS in Leiden een goed startpunt. Daar wordt op verschillende manieren verkend welke nieuwe mogelijkheden deze technologie biedt.
VORtech wil graag een brug zijn tussen enerzijds academisch onderzoek op het gebied van computational science en anderzijds de toepassing daarvan in de industrie en bij overheden. Daarom volgen we actief wat er zoal aan onderzoek gebeurt. Dat leidde tot een boeiend gesprek met Rob van Nieuwpoort, hoogleraar in Leiden in de groep Efficient Computing and eScience.
Rob van Nieuwpoort heeft een flinke track record op het gebied van computational science. Hij was onder meer directeur van het eScience center in Amsterdam dat zich inzet om het niveau van wetenschappelijke softwareontwikkeling in Nederland op een hoger plan te brengen. Daarnaast was hij parttime hoogleraar in Amsterdam. Sinds anderhalf jaar heeft hij zijn eigen onderzoeksgroep in Leiden waar hij voluit het onderzoek kan doen dat hem boeit.
Efficiënte code genereren voor speciale hardware
Het project “SuperCode” is zo’n onderzoeksproject. Rob vertelt er enthousiast over: “met SuperCode willen we Large Language Modellen (LLMs) zoals ChatGPT gebruiken om code te genereren voor emerging hardware. Daarmee bedoelen we bijvoorbeeld de speciale hardware die voor AI-toepassingen wordt ontwikkeld. Die kun je ook prima gebruiken voor andere soorten berekeningen. Maar als je die niet heel zorgvuldig programmeert haal je daar nooit de performance uit die erin zit. Het idee is om LLMs te gebruiken om daarbij te helpen”.
“Nu al worden LLMs gebruikt om te helpen bij het programmeren. Onze studenten gebruiken het volop. Wij gaan in ons onderzoek een stap verder”, aldus Rob. “We nemen zo’n LLM en gaan dat finetunen met voorbeelden van code die geoptimaliseerd is voor een bepaalde hardware. Daarbij voeden we het model ook met informatie over die hardware. Vervolgens gaan we kijken of het model code kan genereren voor een hardware-architectuur waar hij niet voor getraind is. Als het lukt om LLMs daarbij te laten helpen dan heb je zowel snellere software als software die minder energie gebruikt. Dat laatste is ook een belangrijk thema aan het worden.”
Het SuperCode project staat open voor extra industriële partijen die mee willen kijken en mogelijk casestudies willen aandragen. Rob: “het is heel nuttig als we deze technieken ook wat breder kunnen uittesten”.
Foundation models voor technische toepassingen
Een ander project waar de groep van Rob van Nieuwpoort aan gaat werken, het FIND-project, verkent een hele andere toepassing van machine learning voor rekensoftware. Rob legt uit: “Het idee hier is om zogeheten foundation models te maken voor technisch-wetenschappelijke toepassingen. Een foundation model is een machine learning model dat getraind is voor een brede categorie toepassingen. Het trainen van zo’n foundation model is heel veel werk, maar als je het eenmaal hebt, dan kun je het vervolgens relatief eenvoudig finetunen naar allerhande specifieke toepassingen. Dat wordt nu al veel gedaan om AI-applicaties bijvoorbeeld om een chatbot te maken die de gebruiker kan adviseren over kledingkeuzes. Het foundation model heeft dan al alle kennis om soepel met mensen te communiceren en bij het finetunen breng je de kennis over mode in.
Wat wij willen doen is dit soort foundation models te maken voor bijvoorbeeld medische diagnostiek. Die kun je dan gaan finetunen naar applicaties voor MRI of voor radiodiagnostiek. Dat zou het veel makkelijker moeten maken om snel AI-toepassingen te maken voor dit soort toepassingen.”
Het FIND-project is al goedgekeurd en gaat waarschijnlijk binnenkort van start. Naast dit project en Supercode heeft de groep van Rob van Nieuwpoort ook nog andere projecten gehonoreerd gekregen. Het is duidelijk dat hun werk ook door onderzoeksfinanciers als relevant gezien wordt. Rob van Nieuwpoort: “Wat ik vooral wil, is dat ons onderzoek impact heeft.” Dat moet met dit soort projecten zeker lukken.