De blog van The Write Mind

Clustering kan ook ingenieurs slimmer maken

Clustering kan ook ingenieurs slimmer maken
In deze Simsalabim post komen volgende onderwerpen aan bod:

Clustering kan ook ingenieurs slimmer maken

En, vond je de blog post visueel machinaal leren A Visual Introduction to Machine Learning ook zo verhelderend om te lezen? De SVG-animaties maken het lezen inderdaad tot een wauw-ervaring. Laat ons dan nu eens dieper ingaan op een heel specifieke groep algoritmen: die voor “unsupervised” machinaal leren. Zoals de naam al aangeeft, benaderen die algoritmen een reeks gegevens zonder enige voorkennis. In volle vrijheid – zonder enige uitwendige controle – zetten zij die gegevens om in kennis.

Verborgen structuren ontdekken 

Net daarom zijn algoritmen voor unsupervised machinaal leren in staat om heel creatief uit de hoek te komen. Ze leggen voor het menselijk brein verborgen structuren bloot binnen grote hoeveelheden meerdimensionale gegevens. Op die manier reiken zij nieuwe (vaak verrassende) inzichten aan.

In het Engels hebben ze daar een mooie term voor: data discovery. Jammer genoeg heb ik niet zo direct een goede Nederlandse vertaling bij de hand, suggesties zijn steeds welkom. Wat er ook van zij, de term data discovery is werkelijk heel geschikt – ook in het kader van Computer Aided Engineering (CAE) processen. Een engineering-by-objective aanpak levert immers steeds een massa gegevens op. Die geven echter niet vanzelf hun geheimen prijs. Ze moeten worden ontdekt en vertaald naar ontwerpinformatie die bevattelijk is voor het menselijk brein.

Algoritmen voor unsupervised machinaal leren zijn er in diverse soorten. Om dit onderwerp zo concreet mogelijk te te benaderen, spitsen we in deze blog post onze aandacht toe op clustering technieken. In een volgende bijdrage zullen we het dan hebben over self-organizing maps.

Clustering zorgt voor structuur

Clustering staat voor het zodanig groeperen van gegevens dat alle gegevenspunten binnen één cluster meer op elkaar lijken dan op punten die tot andere clusters behoren. Anders gezegd: clustering staat voor het zodanig groeperen van gegevens dat de verschillen tussen clusters onderling groter zijn de verschillen binnen elke cluster afzonderlijk.

Clustering wordt in zeer diverse domeinen toegepast: medische beeldvorming, marktonderzoek, aanbevelingssystemen,… Steeds gebeurt dat om grote hoeveelheden meerdimensionale gegevens te structureren zodat die eenvoudig kunnen worden geïnterpreteerd.  Het hoeft dan ook niet te verwonderen dat clustering technieken ook in opgang zijn in het kader van Computer Aided Engineering (CAE) processen.

Clustering helpt bij het opsporen van kwaadaardige cellen

Bij het maken van een PET scan worden clustering technieken ingezet om verschillende types weefsel en bloed duidelijk te onderscheiden op een 3-dimensionaal beeld. Het isotoop dat bij een PET scan wordt ingespoten nestelt zich op tumoren en/of uitzaaiingen. Die hebben een verhoogde stofwisseling in vergelijking met goedaardige cellen. Toepassing van clustering op digitale beelden die door een PET scanner worden gemaakt, laat toe om net die cellen met verhoogde activiteit duidelijk te onderscheiden.

Deze werkwijze is niet alleen een pak comfortabeler voor de patiënt dan een bloedafname of een biopsie. Ze biedt tevens het voordeel dat ook kleine tumoren kunnen worden opgespoord. Goedaardige gezwellen kunnen bovendien makkelijk worden onderscheiden van kwaadaardige gezwellen.

Clustering helpt marktsegmenten identificeren

Clustering wordt ook veel gebruikt bij marktonderzoek. Met name om meerdimensionale gegevens afkomstig van enquêtes of testpanels te verwerken. Clustering stelt marktonderzoekers precies in staat om marktsegmenten te definiëren op basis van consumentenvoorkeuren. Binnen elk segment kunnen zij dan meer diepgaande analyses uitvoeren. Dat levert een schat aan inzichten op die bijzonder nuttig zijn voor een optimale product positionering, om de meest geschikte testmarkten te selecteren of om nieuwe producen te ontwikkelen.

En ja, clustering kan ook ingenieurs helpen!

Toepassingen van clustering binnen Computer Aided Engineering (CAE) leunen trouwens heel nauw aan bij wat gebeurt binnen marktonderzoek. Virtuele simulaties leveren typisch een heel pak meerdimensionale gegevens op. Denk maar aan de vele parameters en resultaten die een rol spelen bij de beoordeling van een ontwerp. Daarbij ontbreekt het binnen simulatiesoftware echter meestal aan de middelen om die massa gegevens voluit te verwerken over een reeks virtuele experimenten heen.

Clustering technieken (zoals die typisch beschikbaar zijn binnen een PIDO platform helpen ontwerpingenieurs echter om virtuele experimenten te groeperen op basis van gelijkaardige eigenschappen. Op die manier wordt de ontwerpruimte gesegmenteerd. Bij de ontwikkeling van een verbrandingsmotor kan dat bijvoorbeeld op basis van brandstofverbruik, op basis van CO2-uitstoot of op basis van geluidsemissie.

Kortom: clustering vertaalt gegevens in kennis

Net zoals een marktonderzoeker meer diepgaande analyses zal uitvoeren om specifieke marktsegmenten beter te begrijpen, zullen ook ingenieursteams verschillende segmenten binnen de ontwerpruimte verder in detail verkennen. Door te werken op homogene sets virtuele experimenten (geljjkaardige CO2-uitstoot of geluidsemissie) worden verbanden blootgelegd die anders wellicht over het hoofd  worden gezien.

Het resultaat is dat ontwerpinformatie wordt ontsluierd binnen de gegevens aangeleverd door een reeks virtuele simulaties (of door een reeks testen op prototypes). Ingenieursteams bouwen zo een pak sneller kennis op. Ze kunnen veel efficiënter de belangrijkste ontwerpopties onderscheiden en heel gericht werken naar een geoptimaliseerd ontwerp toe.

Zo zie je maar: de term data discovery is werkelijk heel geschikt als omschrijving van wat algoritmen voor unsupervised machinaal leren effectief doen. Dat hadden we toch al eerder gezegd, niet?

Interessant? Vergeet deze Simsalabim post niet te delen:
Luc Meulewaeter Clustering kan ook ingenieurs slimmer maken
Ontdek aanverwante Simsalabim posts:
Luc MeulewaeterClustering kan ook ingenieurs slimmer maken