AI Investment Primer:de basis leggen (deel I)

Samenvatting

Wat is AI?
  • Kunstmatige intelligentie (AI), kan eenvoudig worden uitgelegd als intelligentie die wordt aangetoond door machines, in tegenstelling tot de natuurlijke intelligentie die wordt vertoond door mensen en andere dieren.
  • Machine learning is een subset van technieken die worden gebruikt in AI, en deep learning is een subset van technieken die worden gebruikt bij machine learning.
  • Er zijn drie belangrijke golven van AI-ontwikkeling geweest. De eerste in de jaren '50 en '60, de tweede in de jaren '80 en '90, en de derde begon tien jaar geleden en heeft sinds 2016 aan bekendheid gewonnen (AlphaGo).
Wat is er speciaal aan deze golf van AI?
  • Deze golf van AI wordt aangedreven door de groei en populariteit van deep learning.
  • Hoewel deep learning-technieken al sinds de jaren 60 bestaan, waren de benodigde rekenkracht en data tot de afgelopen jaren niet geavanceerd genoeg om massale commerciële toepassingen te ondersteunen.
  • De reden waarom deep learning zo opwindend is, is dat, simpel gezegd, deep learning veel krachtigere prestaties mogelijk maakt dan andere leeralgoritmen.
Belangrijkste componenten van succesvolle AI-toepassingen.
  • AI-applicaties moeten een goed gedefinieerd (specifiek) en wenselijk (gericht op urgente en duidelijke pijnpunten van klanten) oplossen. Gezichtsherkenning, machinevertaling, auto's zonder bestuurder, zoekmachineoptimalisatie, het zijn allemaal goed gedefinieerde wenselijke problemen. Het ontbreken van goed gedefinieerde gewenste problemen is echter de reden waarom het moeilijk is om bijvoorbeeld een algemene huisreinigingsrobot te produceren.
  • Algorithmen voor machinaal leren vereisen toegang tot schone en goed gelabelde gegevens. Deze oefening voor het verzamelen van gegevens kan moeilijk of gemakkelijk zijn, afhankelijk van de commerciële toepassing die u ontwikkelt.
  • Een AI-bedrijf moet robuuste en schaalbare algoritmen ontwikkelen. Om dit te bereiken zijn er drie must-haves:een grote hoeveelheid goed gelabelde data, het juiste talent en het vertrouwen dat deep learning de juiste technologie is om het probleem op te lossen.
  • Succesvolle AI-toepassingen vereisen veel rekenkracht. Hoe geavanceerder het kunstmatige-intelligentie-algoritme (bijv. deep learning neurale netwerken), hoe meer rekenkracht er nodig is, hoe duurder de operatie.

De afgelopen jaren is de wereld getuige geweest van een explosie van belangstelling voor kunstmatige intelligentie (AI). Een concept dat ooit voornamelijk beperkt was tot het Sci-Fi-genre, is een onderdeel geworden van ons dagelijks leven. We lezen er de hele tijd over in het nieuws, zien video's van eng uitziende robots die dansen op de melodie van Uptown Funk , en hoor hoe AI-toepassingen zelfs de meest onverwachte sferen van ons dagelijks leven binnensluipen. Maar is het een hype?

Het zou kunnen. Volgens Gartner's Hype Cycle for Emerging Technologies bevinden gedemocratiseerde AI-trends, waaronder AI PaaS (platform as a service), kunstmatige algemene intelligentie, autonoom rijden, diep leren, zich allemaal op verschillende punten op de curve, waarbij Deep Neural Nets zich op het hoogtepunt van opgeblazen verwachtingen. Maar we profiteren ook al elke dag van AI. Van Siri tot Cortana tot Alexa, we kunnen nu praten met slimme assistenten. Van Google's AI-aangedreven zoekmachine tot Instagram-filters, we genieten nu van het gemak van snelle, relevantere reacties op onze behoeften. In China, waar AI-innovatie floreert, zorgen bedrijven zoals Face++'s gezichtsherkenningstechnologie voor instant ID-authenticatie voor banken, terwijl apps zoals TikTok korte video's naar miljoenen tieners sturen (in feite een aanzienlijke controverse veroorzaken).

Persoonlijk geloof ik dat, hoewel er zeker wat overdreven verwachtingen en bedrijven zijn, AI de toekomst is . Ik heb mijn eigen AI-startup in een vroeg stadium opgericht om deze unieke kans om deel te nemen aan de technologische revolutie vast te leggen. Als ex-VC-investeerder ben ik ook constant op zoek naar investeringsmogelijkheden in AI. Ik ben daarom van mening dat, ondanks het onmiskenbare lawaai dat de ruimte omringt, de enorme toename van AI-investeringen ook gerechtvaardigd is.

Maar met dit in gedachten verbaast het me dat er, met name onder de beleggersgemeenschap, nog steeds een groot begripsverschil is. Beleggers willen graag geld aan het werk zetten, maar missen vaak belangrijke basiskennis die naar mijn mening nodig is om een ​​effectieve belegger op dit gebied te zijn. Het doel van dit artikel is daarom om nuttige context en informatie te delen en te bieden voor diegenen die geïnteresseerd zijn in investeren in dit opwindende veld. Gezien de breedte van het onderwerp, heb ik mijn gedachten in twee delen gesplitst, de eerste gericht op het bespreken van een paar essentiële elementen die je moet weten om aan de slag te gaan met de AI-reis - een soort 101. Het tweede deel van deze serie zal meer praktisch zijn en dieper ingaan op het onderwerp van het evalueren van AI-investeringen en de verschillende manieren om te investeren.

NB Dit bericht is niet technisch bedoeld. Het is bedoeld voor beleggers en de bredere financiële gemeenschap, en dus voor niet-technische lezers.

Wat is AI?

Er zijn eigenlijk veel definities van AI, dus als ik wordt gevraagd om het te definiëren, gebruik ik vaak de goede oude Wikipedia, die, voor niet-technisch publiek, denk ik een bevredigende definitie biedt:

Kunstmatige intelligentie (AI), ook wel machine-intelligentie genoemd, is intelligentie die wordt gedemonstreerd door machines, in tegenstelling tot de natuurlijke intelligentie die wordt vertoond door mensen en andere dieren.

Met andere woorden, elke niet-natuurlijke intelligentie is "kunstmatige" intelligentie, ongeacht hoe deze wordt bereikt. Technieken die worden gebruikt om AI te bereiken, zijn onder meer als-dan-regels, logica, beslissingsbomen, regressies en machine learning, inclusief deep learning. Een van mijn favoriete en leuke tools om uit te leggen hoe AI werkt, is deze video over hoe een computer Super Mario leert spelen.

Als je het over AI hebt, hoor je steevast deze drie sleutelbegrippen:AI, machine learning en deep learning. Ze worden soms door elkaar gebruikt, maar ze zijn verschillend. Simpel gezegd, machine learning is een subset van technieken die in AI worden gebruikt. Deep learning is een subset van technieken die worden gebruikt bij machine learning .

De Nvidia-blog doet goed werk door de relatie tussen de drie termen samen te vatten. Het biedt ook een handig overzicht van de drie golven van AI-ontwikkeling. De eerste golf van AI was in de jaren 50 en 60 en zag enkele van de eerste grote mijlpalen, zoals toen de IBM 701 het damspel won van dammeester Robert Nealey. In de jaren 80 en 90 versloeg Deep Blue de menselijke meester Kasparov bij Chess. In maart 2016 versloeg AlphaGo de #1 Go-speler Lee Sedol. Elke keer dat AI menselijke meesters versloeg in games, leidde dit tot een nieuwe hype voor AI. Omdat de technologie dan geen toepassingen kon leveren die aan de verwachtingen van het publiek voldoen, zou de AI-hype veranderen in AI-winter, met afnemende investeringen en onderzoekssubsidies.

Zoals eerder vermeld, is machine learning een subset van AI. Volgens Nvidia is machine learning in de basis "de praktijk van het gebruik van algoritmen om gegevens te ontleden, ervan te leren en vervolgens een bepaling of voorspelling te doen over iets in de wereld. Dus in plaats van softwareroutines met de hand te coderen met een specifieke set instructies om een ​​bepaalde taak uit te voeren, wordt de machine 'getraind' met behulp van grote hoeveelheden gegevens en algoritmen die hem de mogelijkheid geven om te leren hoe de taak moet worden uitgevoerd." Een veelvoorkomend voorbeeld van machine learning is de spamfilter. Het spamfilter van Google kan spam herkennen door triggerwoorden zoals "Prince", "Nigeria" en "luxury watch" te identificeren. Het kan ook blijven "leren" van de handmatige classificatie van spam door gebruikers. Een e-mail met het bericht "stuur $ 1000 om dit exclusieve kankermedicijn naar de volgende bankrekening te krijgen" werd bijvoorbeeld gemist door de spamfilter van Google. Zodra een gebruiker het als spam bestempelt, analyseert Gmail alle trefwoorden in die specifieke e-mail en "leert" om e-mails met de combinatiewoorden "$ 1000", "drug" en "bankrekening" in de toekomst als spam te behandelen. Er zijn veel wiskundige modellen die door professionals worden gebruikt om aan machine learning te doen, b.v. regressies, logistiek, Bayesiaanse netwerken, clustering.

Wat is er speciaal aan deze golf van AI?

Deze golf van AI wordt aangedreven door de populariteit van deep learning . Als onderdeel van machine learning is deep learning niet recentelijk uitgevonden. In feite, volgens Wikipedia, "werd het eerste algemene, werkende leeralgoritme voor gesuperviseerde, diepe, feedforward, meerlagige perceptrons in 1965 gepubliceerd door Alexey Ivakhnenko en Lapa". Omdat de rekenkracht en de gegevens echter niet geavanceerd genoeg waren om de massale commerciële toepassing van deep learning-technieken te ondersteunen, won het pas in 2006 aan populariteit toen Geoffrey Hinton et al. hun baanbrekende paper publiceerden, "A Fast Learning Algorithm for Deep Belief Netten.” Ondanks de AI-winter van de jaren 90 en de eerste helft van 2000, blijven een paar wetenschappers, waaronder de drie academische goeroes van deep learning, Geoffrey Hinton, Yann LeCun en Yoshua Bengio, werken aan deep learning in het academische veld. De snelle doorbraak van rekenkracht, bijvoorbeeld cloudcomputing en GPU's, in combinatie met de beschikbaarheid van big data via de digitale economie, hebben de implementatie van deep learning-algoritmen in het afgelopen decennium mogelijk gemaakt. Het onderzoek naar zelfrijdende auto's van Google begon bijvoorbeeld in 2009.

Technisch gesproken kan deep learning worden gedefinieerd als "een klasse van machine learning-algoritmen die:

  • gebruik een cascade van meerdere lagen niet-lineaire verwerkingseenheden voor het extraheren en transformeren van kenmerken. Elke volgende laag gebruikt de uitvoer van de vorige laag als invoer.
  • leren onder toezicht (bijv. classificatie) en/of ongecontroleerde (bijv. patroonanalyse) manieren.
  • leer meerdere representatieniveaus die overeenkomen met verschillende abstractieniveaus; de niveaus vormen een hiërarchie van concepten.”

De sleutel is "meerdere lagen", vergeleken met traditionele machine learning. Hoe zou je bijvoorbeeld een kat van een hond onderscheiden? Als je machinaal leren zou gebruiken, zou je een paar kenmerken kunnen extraheren die zowel honden als katten gemeen hebben, zoals twee oren, een harig gezicht, de afstand tussen ogen en neus en mond, enz. En je zou een resultaat kunnen krijgen dat zegt de foto is 50% hond, 50% kat - niet erg handig. Met behulp van deep learning weet je echter niet eens wat de onderscheidende kenmerken van een kat versus een hond zijn, maar de machine zou, door meerdere lagen van het creëren van nieuwe functies en honderden (of duizenden) statistische modellen, een meer nauwkeurige uitvoer - b.v. 90% hond, 10% kat. De twee grafieken hieronder illustreren hoe een neuraal netwerk 'leert' en wat het verschil is tussen klassieke machine learning en neurale netwerken.

Lezers kunnen na het lezen van het bovenstaande hun hoofd krabben, en terecht. Maar om terug te gaan naar ons oorspronkelijke doel:vanuit het standpunt van een belegger, wat is er zo speciaal aan deep learning? Je zou deze vraag kunnen beantwoorden met verschillende, meer gecompliceerde technische verklaringen, maar heel simpel gezegd, de grafiek hieronder aan de linkerkant maakt het heel duidelijk:deep learning zorgt voor veel krachtigere prestaties dan andere leeralgoritmen. Neem het voorbeeld van spraakherkenning zoals beschreven in het Microsoft-blog (grafiek rechtsonder):het oorspronkelijke foutenpercentage voor spraakherkenning in 1988 was 60-70%, terwijl het nieuwe Microsoft-systeem dat gebruikmaakt van deep learning in 2014 slechts 6,3% bedroeg.

Belangrijkste componenten van succesvolle AI-applicaties

Ik geloof dat er vier belangrijke componenten zijn voor het succes van een machine learning (inclusief deep learning) product:goed gedefinieerde gewenste problemen, gegevens, de algoritme(n) en rekenkracht .

Eerst en vooral moet de AI-toepassing een goed gedefinieerd (specifiek) en wenselijk (gericht op dringende en duidelijke pijnpunten van klanten) probleem oplossen . Denk aan de verschillende spellen die de computer geleerd heeft te spelen over de 3 verschillende golven van AI:dammen, schaken, Go. Het waren zeer goed gedefinieerde problemen en daarom gemakkelijker op te lossen voor een computer. Gezichtsherkenning, machinevertaling, auto's zonder bestuurder, zoekmachineoptimalisatie, het zijn allemaal goed gedefinieerde wenselijke problemen. Het ontbreken van goed gedefinieerde gewenste problemen is echter de reden waarom het zo moeilijk is om bijvoorbeeld een algemene huisreinigingsrobot te produceren. Eenvoudige huishoudelijke taken, b.v. bekers verzamelen en wasgoed in de mand doen, vereist te veel problemen oplossen. Het vereist bijvoorbeeld dat de machine identificeert welke voorwerpen moeten worden opgepakt (bekers, vuile was en niet schone was, enz.), waar te gaan en hoe daar naartoe te gaan (vermijd obstakels in het huishouden en reis naar de gewenste locatie), elk object met de gewenste kracht hanteren, zodat het de beker of het wasgoed niet breekt, enz.

Ten tweede vereist het ontwikkelen van een machine learning-algoritme toegang tot schone en goed gelabelde gegevens . Dit komt omdat deze algoritmen zijn gebouwd door verschillende statistische modellen een grote hoeveelheid gegevens te geven die goed zijn gelabeld, om de nodige voorspellende relaties tot stand te brengen. Deze oefening voor het verzamelen van gegevens kan moeilijk of gemakkelijk zijn, afhankelijk van de commerciële toepassing die u aan het ontwikkelen bent. Om bijvoorbeeld de benodigde gegevens te verzamelen die nodig zijn om een ​​computervisie-algoritme voor wijndruivenvelden te ontwikkelen, had mijn startup veldafbeeldingen nodig van verschillende locaties met verschillende variëteiten en nog moeilijker - verschillende seizoenen. Omdat elk seizoen één jaar duurt, zal het jaren duren om bevredigende producten te krijgen. Als u daarentegen een goed gezichtsherkenningsalgoritme in China wilt ontwikkelen, om b.v. 10 miljoen afbeeldingen, je hoeft alleen maar een camera een week lang in een drukke straat in Peking op te zetten en de taak is voltooid. Een ander voorbeeld is de #1 AI-aangedreven gepersonaliseerde nieuwsaggregator in China, Toutiao, die leert over uw persoonlijke nieuwsvoorkeuren en u alleen het meest relevante nieuws voor u laat zien. Het verzamelen van gegevens is in dit geval weer veel gemakkelijker, b.v. het aantal artikelen dat u leest in elke nieuwscategorie, de hoeveelheid tijd die u aan elk artikel besteedt, enz.

Ten derde moet een AI-bedrijf robuuste en schaalbare algoritmen ontwikkelen . Om dit te bereiken zijn er drie must-haves:een grote hoeveelheid goed gelabelde data (zoals hierboven besproken), het juiste talent en het vertrouwen dat deep learning de juiste technologie is om het probleem op te lossen. AI-bedrijven moeten het juiste talent hebben om de benodigde algoritmen te ontwikkelen, maar deze zijn zeer gespecialiseerd, duur en schaars. Toen ik bijvoorbeeld op zoek was naar personeel voor mijn startup, ontdekte ik dat ik minimaal datawetenschappers (meestal PhD's) nodig had om algoritme-prototypes te ontwikkelen, ingenieurs om frameworks te ontwerpen, programmeurs (TensorFlow, Python, C++ etc) om te coderen in schaalbare programma's en mensen om ze samen te stellen (productmanager, UX, UI, enz.).

Een andere overweging is rekenkracht . Waarom? Omdat neurale netwerken voor diep leren veel meer rekenkracht vereisen dan de andere AI-methoden. Voor dezelfde taak van het identificeren van een hond in een afbeelding, kan het trainen van het model met behulp van een niet-deep learning-algoritme bijvoorbeeld 10 statistische modellen nodig hebben met een dataset van 1 GB. Het model van diepe neurale netwerken heeft mogelijk bijvoorbeeld 1000 statistische modellen nodig die door een dataset van 100 GB lopen. De resultaten zijn beter met netwerken, maar de benodigde rekenkracht is veel groter. Als gevolg hiervan hebben deze modellen niet slechts één computer nodig (zoals wat we op onze pc doen), maar gedistribueerd computergebruik waarbij elke GPU bijvoorbeeld 5% van de berekening afhandelt, zodat 20 GPU's samen het benodigde rekenvolume aankunnen. Dit betekent op zijn beurt dat je je eigen GPU-clusterservers moet bouwen of de rekenkracht moet huren van platforms zoals AWS. De rekenkracht van cloudcomputing of uw eigen servers is kostbaar, hoewel de kosten per eenheid van computergebruik in alle eerlijkheid voortdurend zouden moeten dalen (volgens de wet van Moore).

Conclusie

Velen geloven dat dit de beste tijd is om AI-doorbraken en startups te zien, omdat de digitalisering van veel industrieën en consumenteninternet een grote hoeveelheid doelbewust verzamelde, netjes georganiseerde, digitale gegevens beschikbaar maakt. De ontwikkeling van Nvidia's GPU en Intel's FPGA maakt het veel goedkoper en sneller om de nodige berekeningen uit te voeren. De huidige AI-golf van innovatie wordt daarom aangedreven door belangrijke vooruitgang in deep learning .

Maar om een ​​AI-toepassing succesvol te laten zijn, heeft men een goed gedefinieerd gewenst probleem, gegevens, algoritme en aanzienlijke rekenkracht nodig. Voor leidinggevenden die dit artikel lezen en overwegen om AI te gebruiken om hun bedrijf te versterken, zijn de vier belangrijkste componenten die hierboven zijn genoemd ook van toepassing.

Hoe kom je meer te weten over AI? Er zijn tal van boeken, seminars, Coursera-cursussen, onderzoekspapers en organisaties zoals Deep Learning om meer te weten te komen over AI. Omdat de focus van dit artikel ligt op investeerders die de basis van AI willen kennen, heb ik niet veel van de populaire AI-onderwerpen besproken, zoals het potentieel van AI als een bedreiging, de toekomstperspectieven van de industrie, AI-investeringen, de voordelen en nadelen van verschillende algoritmen (bijv. CNN), prototyping versus schaling, belangrijke programmeertalen, enz. In deel 2 van deze serie zal ik ingaan op hoe AI-bedrijven kunnen worden beoordeeld vanuit een beleggersperspectief.


Bedrijfsfinanciering
  1. boekhouding
  2. Bedrijfsstrategie
  3. Bedrijf
  4. Klantrelatiebeheer
  5. financiën
  6. Aandelen beheer
  7. Persoonlijke financiën
  8. investeren
  9. Bedrijfsfinanciering
  10. begroting
  11. Besparingen
  12. verzekering
  13. schuld
  14. met pensioen gaan