Door slim samenvoegen van Quantum Computing en Machine Learning kan in de nabije toekomst al worden geëxperimenteerd met optimalisatie van huidige beveiliging en ontgrendelingstechnieken.
Zal QML de IT-security hoofdzakelijk nieuwe middelen voor beveiliging geven, of nieuwe uitdagingen?
Waar Machine Learning (ML) sinds een aantal jaar in rap tempo onmisbaar is geworden in veel moderne IT-security, komt anno 2022 steeds meer aandacht voor de volgende generatie computers en haar implicaties. Dit artikel neemt je mee in de wereld van Quantum Technologie (QT), en verklaart hoe de twee werelden van ML en QT elkaar vinden in een (nu nog) niche van de cybersecurity sector: Quantum Machine Learning (QML). Je leest wat QML in potentie kan betekenen voor nu nog typische ML-taken als classificatie en regressie. Voordat we daar aan toe komen, leggen we eerst kort de geschiedenis van ML en de basisprincipes van QT uit.
Het is februari 1987. Binnen DARPA publiceert informaticus Dorothy Elizabeth Denning een paper over computerinbraakdetectiesystemen, gestoeld op principes die we vandaag de dag nog gebruiken in machine-learning[1]. Haar detectiesysteem berust op het ontdekken van een anomalie: een ongebruikelijk event. Informatie die in een systeem ingevoerd wordt die anders is dan dat het systeem herkent, wordt gescand en bestempeld met de tag ‘mogelijk gevaarlijk’. Het systeem is ook wel unsupervised: de computer wordt niet door mensen bijgestuurd. Machine Learning is geboren.
Tientallen jaren later, met het opkomen van het fenomeen big data, koppelen de eerste wetenschappers deze unsupervised modellen met supervised modellen. Deze supervised modellen kunnen informatie uit andere bronnen halen (bijvoorbeeld een blacklist aan verdachte webpagina’s) en zo een model verrijken (bijvoorbeeld een spamfilter). Als een binnenkomend bericht anders is dan alle andere berichten die tot dan toe zijn binnengekomen én er staat een verdachte weblink in die elders geclassificeerd is als spam, dan pas classificeert een computer het bericht als spam. Hoewel dit handig is bij het opdoen van nieuwe kennis, sijpelen positieve en vals-negatieve berichten soms nog door. Hierdoor is de noodzaak tot cybersecurity nog pertinent.
Vandaag de dag zetten cybersecurity analisten artificiële intelligentie (AI) op veel plekken in. Niet alleen omdat het risico is toegenomen binnen cybersecurity – denk aan recente ransomware-aanvallen en datalekken – maar ook omdat de hoeveelheid informatie die moet worden geanalyseerd is geëxplodeerd. Menselijke capaciteit is simpelweg niet toereikend om handmatig e-mails en bestanden te controleren op gevaar. De organisatie dient te vertrouwen op de regels die de computer zijn meegegeven en de regels die de computer zelf middels AI schrijft.
De cybersecurity industrie kan niet zonder Artificiële Intelligentie (AI), zo beaamt 69% van de ondervraagde bedrijven in een eerder verschenen studie uitgevoerd door Capgemini (2019)[2]. Onder het brede scala van toepassingen binnen AI is Machine Learning (ML) vaak toegepast om sneller gevaren te kunnen detecteren, voorspellen en erop te kunnen handelen. Erkende toepassingen waar hevig gebruikt gemaakt wordt van ML zijn niet alleen te vinden in (reeds genoemde) spam-filters, maar ook in online betalingsportalen en certificaten/compliance-controlemechanismen. ML wordt niet alleen aan de kant van de verdediging gebruikt: ook kwaadwillenden gebruiken steeds vaker machine learning om complexe data te analyseren en zichzelf zo toegang te verschaffen tot allerlei informatie.
Er is een explosieve toename in vraag aan rekenkracht voor machine learning. Vanaf 2016 verdubbelt elke drie drie tot 5 maanden het totaal aantal parameters in machine learning modellen[3]. Deze vuistregel is duidelijk te zien bij modellen voor natural language processing. In 2018 bracht OpenAI GPT-1 uit, destijds van de grootste modellen met 117 miljoen parameters. Vier jaar later in, in 2022 komt GPT-4 uit met 100 biljoen parameters. Voor wie deze getallen duizelen; dit is een vermenigvuldiging van een miljoen keer in slechts vier jaar.
Tegelijkertijd is de rek er bijna uit in de ontwikkeling van klassieke computers. Over de afgelopen decenia zijn computers steeds krachtiger geworden doordat ze meer transistoren bevatten dankzij miniaturisatie[4]. Innovatie verliep zo snel dat het aantal transistors elke twee jaar verdubbelde. Dit fenomeen staat bekend als Moore’s law. Moore’s law loopt echter op zijn einde, omdat transistors niet verder verkleind kunnen worden en het proces van miniaturisatie stokt.
Hier komt quantum computing om de hoek kijken. Quantum computers werken op een fundamenteel andere manier, en zijn dus niet slechts een snellere klassieke computer. Waarbij klassieke computers gebruik maken van bits, de binaire basis eenheid voor informatie, gebruiken quantum computers quantum bits, ofwel qubits. Qubits kunnen niet alleen in de waardes nul en een aannemen, maar kunnen zogezegd in een superpositie van een en nul zijn. Omdat qubits fundamenteel verschillen bits, is ook de programeertaal, de algoritmes, en de applicaties verschillend voor quantum computers dan voor klassieke computers. In het volgende hoofdstuk gaan we in hoe quantum algorithmes zich kunnen onderscheiden van klassieke algorithmes.
Quantum computer | Een fundamenteel nieuw type computer welke gebruikt maakt van fenomenen uit de quantum mechanica. |
Qubit | De fundementele informatie eenheid van quantum computers. Anders dan bij bits, de informatie eenheid bij klassieke computers, kunnen qubits niet alleen de waardes een en nul aannemen, maar een zogenaamde superpositie van deze twee waardes aannemen. |
Machine learning | Het gebruik van data en modellen om met computers menselijk leren te imiteren. |
Quantum machine learning | Machine learning welke draait op quantum computers |
Begrippen BOX: Quantom computer, Qubit, Machine Learning en Quantum Machine learning
Je zou quantum algoritmes kunnen opdelen in twee types; algoritmes die complexe vergelijkingen sneller kunnen oplossen, en algoritmes die door het grote geugen van quantum computers tot betere antwoorden kunnen leiden.
De eerste catagorie omvat quantum algoritmes die complexe problemen oplossen door een immense rekenkracht. In sommige gevallen is er een exponentiële versnelling mogelijk. Dit betekent dat als het probleem groot genoeg is, het algoritme miljoenen keren sneller kan zijn. Shor’s algoritme is hiervan het beste voorbeeld. Dit beducht algoritme, welke bedacht is door Peter Shor in 1994 is in staat om kritische encryptie, zoals RSA en Diffi-Hellman, te breken door de regelmaat in grote reeksen getallen te vinden. De kracht van de encryptie is gebaseerd op het idee dat computers miljarden jaren nodig hebben om de sleutel te vinden. Dit is niet langer het geval wanneer quantum computers sterk genoeg zijn, waardoor een grote cybersecurity kwetsbaarheid ontstaat. Dit vraagt om een grote, en urgente update naar nieuwere encryptiemethodes.
Naast het Shor’s algoritme zijn er enkele andere algoritmes bedacht die een flinke versnellingen kunnen bieden. Het HHL algoritme (vernoemd naar de ontwerpers Harrow, Hassidim en Lloyd) is in staat om lineaire systemen van vergelijkingen op te lossen met een exponentiele versnelling. Omdat lineaire algebra de basis vormt van machine learning, zou dit algoritme mogelijk het trainen van deep learning processen kunnen versnellen. Hierdoor zouden kunstmatige intelligentie modellen sneller, en kosten-effectiever op grote data sets getraind kunnen worden. Deze modellen worden dan krachtiger en nauwkeuriger. Het HHL algoritme kan echter maar onder strikte condities toegepast worden en blijkt in de praktijk moeilijk te implementeren. Daarnaast zijn applicaties in deze categorie afhankelijk van quantum geheugen (QRAM) voor het efficiënt laden van klassieke data naar quantum computers. Omdat QRAM nog niet uitgevonden is, blijven deze algoritmes voorlopig toekomstmuziek.
Naast het versnellen van het machine learning process, zou QML ook een voordeel kunnen bieden ten opzichte van klassieke machine learning door nauwkeurigere resultaten te verkrijgen met minder data. Quantum computers kunnen namelijk gebruik maken van een groter geheugen dan klassieke computers: qubits kunnen niet alleen de waarde een en nul aan kunnen nemen, maar ook alle waarden hier tussen in. Sommige problemen zouden beter gerepresenteerd zijn in het geheugen van quantum computers, en daarom efficiënter opgelost kunnen worden.
Het principe hiervan is vergelijkbaar klassieke kernel methods, welke veel gebruikt worden in machine learning. Kernel methods transformeren data naar een hogere dimensie, waardoor makkelijker verbanden gevonden worden. Quantum machine learning werkt op een vergelijkbare manier, door klassiekedata in quantum data te vertalen.
Er is in 2021 veel onderzoek gedaan naar deze categorie van quantum algorithmes, en inmiddels zijn er publicaties over quantum support vector machine (qSVM), quantum natural language processing (qNPL), quantum convolutional neural net (qCNN), quantum generative adversarial network (qGAN) en meer.
Een relevant voorbeeld voor cybersecurity is (quantum) Natural Language Processing (NLP). NLP wordt gebruikt voor bijvoorbeeld het doorgronden van documenten of het genereren van phishing scripts. Quantum NLP zou mogelijk beter kunnen presteren dan klassieke algortimes.
De intuitie hierbij is dat taal interactief is: denk aan het subtiele verschil tussen een bank om op te zitten en daar waar je je geld parkeert of de plaats van woorden in een zin. Voor klassieke computers kost het veel rekenkracht om alle verschillende opties langs te lopen (wat wordt bedoeld met ‘de bank’ in de zinnen ‘Jip gaat naar de bank’ of ‘jip gaat naar de bank kijken’). Het eerder genoemde GPT-3 model van Facebook, het meest uitgebreide NLP model, kan dit verschil weliswaar ontdekken; het benodigde wel veel rekenkracht. Het GPT-3 model bevat namelijk 180 miljard parameters, en heeft het energieverbruik van een kleine stad nodig om getraind te worden.
De interactiviteit van taal kan efficiënter geprogrammeerd worden in quantum computers. In het grote geheugen van quantum computers kunnen de verschillende betekenissen van woorden en zinnen worden opgeslagen, en door slim gebruik te maken van quantum interference kan de juiste betekenis ontleed worden. Vergelijkbaar met bovenstaande figuur, worden zinnen getransformeerd naar een hogere dimensie, waar de interactie tussen woorden in het geheugen staat, en de quantum computer beter in staat is om verbanden te vinden.
Een bijkomend voordeel is dat qNLP, en veel implementaties van QML in het algemeen, geschikt is voor quantum computers van de nabije toekomst. Deze computers, ook wel NISQ (noisy intermediate scale quantum) computers genoemd, worden gekenmerkd door foutgevoeligheid. Quantum Machine Learning is hier beter bestand tegen fouten dan veel andere algoritmes, doordat ze hybride is. Dit betekent dat klassieke computers een deel van de berekening overnemen, waardoor er minder van de quantum computer word gevraagd. Daarnaast zouden fouten bij machine learning niet altijd voor problemen hoeven te zorgen, maar zou het zo kunnen zijn dat fouten zorgen voor betere generalisatie.
Hoewel er dus veel hoop is dat quantum algoritmes een voordeel zou kunnen bieden voor machine learning, is dit nog niet daadwerkelijk aangetoond. Bij machine learning geldt dat de prestaties moeilijk theoretisch aan te tonen zijn. Dit betekent dat we pas weten of QML echt een voordeel biedt als we het zien voor een realistische toepassing. De komende jaren zullen dit moeten gaan aantonen.
Wat betekenen bovenstaande toepassingen voor het veiligheidsdomein? Algemene uitspraken over de toename in veiligheid en kwetsbaarheid van QML zijn momenteel erg moeilijk te maken. QML is tot nu toe uitsluitend van theoretische aard is geweest, omdat er simpelweg geen QML is in de praktijk. Aangenomen mag echter worden dat dezelfde use-cases waar machine-learning hedendaags voor wordt ingezet met grotere precisie dankzij kwantumtechnologie kan worden ingezet, en dat er ook dezelfde bedreigingen uit voortkomen. ML wordt namelijk ook ingezet bij het vervalsen van face-recognition of het namaken van certificaten waarmee een hacker zich kan voordoen alsof hij/zij bevoegd is om ergens een kijkje te mogen nemen.
We hebben hier slechts het tipje van de sluier kunnen oplichten. Waar bedrijven QML willen gaan inzetten voor krachtigere beveiliging en ontsleuteling (voor bijvoorbeeld opsporing), dienen CISO’s vandaag al de mogelijkheden gaan verkennen die kwantumtechnologie gaat bieden. Dit om te voorkomen dat er straks bij de komst van wijdverspreide kwantumtechnologie een langzaam antwoord komt vanuit de markt, waardoor er gevoelige informatie op straat kan komen te liggen. Resteert enkel de vraag: is uw organisatie al klaar voor de komst van QML?
[3] https://towardsdatascience.com/parameter-counts-in-machine-learning-a312dc4753d0
[4] Onder miniaturisering wordt in de techniek verstaan een proces waarbij structuren worden verkleind met behoud van hun functionaliteit en eventueel ook hun vorm. Het gaat daarbij om het verkleinen van onderdelen van technische apparaten, en uiteindelijk van die apparaten zelf.