Data-analyse en machine learning boeken grote vooruitgang. Maar het is gewoon het volgende dat mogelijk is in de voortdurende evolutie van gegevensproductie, opslag, delen en netwerkleren.
Evolutie van gegevens…
- Gegevensschaarste – In het begin van de jaren negentig en daarvoor waren gegevens vrij schaars, zowel omdat de gegevensproductie laag was (ten opzichte van vandaag) als omdat de mechanismen om gegevens op te slaan en te delen beperkter waren.
- Gegevensproductie – de jaren 2000 werden het tijdperk van sensoren. Met de vooruitgang in de elektronica werden sensoren betaalbaarder. Hierdoor nam de productie van sensoren en de verscheidenheid aan nieuwe sensoren aanzienlijk toe. Met de enorme schaal van ingezette sensoren is de gegevensproductie exponentieel gegroeid - en blijft ze groeien.
- Gegevensopslag – met de sterke toename van de gegevensproductie kwam de toegenomen behoefte aan kosteneffectieve gegevensopslag. Op grote schaal is gegevensopslag nu zo goedkoop geworden dat de kosten te verwaarlozen zijn totdat de gegevensomvang enorm is.
- Gegevens delen – in de jaren negentig genereerden bedrijven hun eigen interne gegevens, maar deze werden grotendeels niet buiten het bedrijf gedeeld. Evenmin was algemene kennis, behalve in gedrukte vorm. Met de komst van internet en de daaropvolgende brede acceptatie (1993+) kwam het delen van gegevens vaker voor dan ooit tevoren (vooral met de verspreiding van API's), maar het bleef grotendeels ongestructureerd.
- Gegevens structureren – technisch onderlegde industrie-experts zagen herhaalbare patronen in de beschikbare informatiesets en begonnen deze te structureren, branche per branche. Verzamelen en sorteren was het volgende "aangrenzend mogelijke", (circa 2004 – 2016). Dit is in feite hoe PrivateEquityInfo.com in 2004 begon. Ik ontdekte een mogelijkheid om gegevens te structureren over private equity en gerelateerde M&A-bedrijven en evenementen. Dit bespaarde mensen enorm veel tijd bij het zoeken naar informatie en professionele netwerken en verhoogde de efficiëntie waarmee fusies en overnames konden worden gedaan.
- Gegevensanalyse - met gestructureerde gegevens hadden we nu de mogelijkheid om, via algoritmen, trends in gegevens in de loop van de tijd te analyseren en op te sporen als nooit tevoren. Dit hielp ons de historische contexten beter te begrijpen, waardoor toekomstige projecties van de historische trends mogelijk werden (2008+). Het biedt ook bruikbare inzichten, in ieder geval richtinggevend.
- Big data – naarmate gegevens steeds nuttiger werden bij het nemen van beslissingen, begonnen we er steeds meer van te verzamelen. Met gegevens (en voldoende verwerkingskracht) is meer beter (ervan uitgaande dat de gegevenskwaliteit niet verslechtert bij gegevensuitbreiding ... vaak een verkeerde veronderstelling).
- Slimme data en machinaal leren - toen de gestructureerde gegevensverzameling van sensoren en verschillende inputs ons (menselijke) vermogen om deze bij te houden aanzienlijk begon te overtreffen, begonnen we machine learning-technieken te gebruiken om relaties binnen de gegevens te leggen en betere voorspellers en indicatoren voor de toekomst te creëren. Machine learning, gevoed met grote hoeveelheden gegevens, is veel krachtiger dan door mensen gecodeerde algoritmen. Uit enorme hoeveelheden gegevens kunnen machines patronen ontrafelen die mensen niet kunnen. Ze kunnen sneller leren, causale correlaties in data ontdekken en zo uitkomsten beter voorspellen dan mensen. Slimme, machinaal aangeleerde, gegevensgestuurde algoritmen, gekoppeld aan massa's gegevens, benaderen nu intelligentie - kunstmatige intelligentie (2015+).
Wat nu?
Netwerkleren – in 2018+ maken machines data aan, stellen deze beschikbaar in vooraf bepaalde, gestructureerde formaten, delen deze data met andere machines en laten het netwerk van machines van elkaar leren. Superintelligentie van machines. Het modelleert het gecompliceerde netwerk van het menselijk brein nauwkeuriger, behalve met meer verwerkingskracht, meer opslagcapaciteit en snellere informatieontsluiting. Dit is niet de singulariteit, maar het zal een enorme sprong voorwaarts zijn - tot het punt dat de intelligentie die door de machines wordt geproduceerd niet zo kunstmatig zal aanvoelen.