En kinesisk oppkomling har ristet teknologibransjen ut av en selvtilfreds tilstand.
BOSTON: Etter at lanseringen av DeepSeek-R1 20. januar 2025 utløste et massivt fall i aksjekursen til databrikke-produsenten Nvidia og kraftige fall i ulike andre teknologiselskapers verdivurderinger, erklærte noen dette som et «Sputnik-øyeblikk» i det kinesisk-amerikanske kappløpet om overherredømme innen kunstig intelligens.
Det stemmer nok at USAs KI-industri trengte å bli ristet litt i. Samtidig reiser episoden noen vanskelige spørsmål.
Den amerikanske teknologibransjen har investert massivt i kunstig intelligens, og Goldman Sachs anslår at «store teknologibedrifter, selskaper og kraftselskaper kommer til å bruke rundt 1 000 milliarder dollar på investeringer de kommende årene for å støtte kunstig intelligens».
Likevel har mange observatører, inkludert jeg, lenge stilt spørsmål ved retningen på investeringene og utviklingen av kunstig intelligens i USA.
Alle de ledende selskapene følger i hovedsak samme oppskrift (selv om Meta har differensiert seg noe med en delvis åpen kildekode-modell), og det virker som om bransjen har lagt alle eggene i én kurv.
Spørsmålet nå er om den amerikanske industrien har andre, enda farligere blindsoner.
Amerikanske teknologiselskaper er besatt av skalerbarhet, uten unntak. Med henvisning til «skaleringslover» som ennå ikke er bevist, antar de at nøkkelen til å låse opp stadig større muligheter ligger i å mate enda mer data og datakraft inn i modellene.
Noen hevder til og med at «skalering er alt du trenger».
Før 20. januar ville ikke amerikanske selskaper vurdere alternativer til grunnmodeller som var forhåndstrent på massive datasett for å forutsi neste ord i en sekvens. Ettersom de prioriterte på denne måten, konsentrerte de seg nesten utelukkende om diffusjonsmodeller og chatboter som skulle utføre menneskelige (eller menneskelignende) oppgaver.
Og selv om DeepSeeks tilnærming stort sett er den samme, ser det ut til at de i større grad har basert seg på forsterkende læring, blanding av ekspertmetoder (ved hjelp av mange mindre, mer effektive modeller), destillasjon og raffinert tankekjede-resonnement. Denne strategien skal ha gjort det mulig å produsere en konkurransedyktig modell til en brøkdel av kostnaden.
Selv om det er uenighet om DeepSeek har fortalt oss hele historien, har denne episoden avslørt «gruppetenkning» i den amerikanske KI-industrien. Denne blindheten for alternative, billigere og mer lovende tilnærminger, kombinert med hype, er nettopp det Simon Johnson og jeg forutså i Power and Progress, som vi skrev rett før den generative KI-æraen begynte.
Spørsmålet nå er om den amerikanske industrien har andre, enda farligere blindsoner. Går for eksempel de ledende amerikanske teknologiselskapene glipp av en mulighet til å utvikle modellene sine i en mer «pro-menneskelig retning»? Jeg mistenker at svaret er ja, men bare fremtiden vet.
Jeg er tilbøyelig til å tro at toppstyrt kontroll hemmer innovasjon.
Så er det spørsmålet om Kina er i ferd med å løpe fra USA. Betyr det i så fall at autoritære, ovenfra-og-ned-strukturer (det James A. Robinson og jeg har kalt «ekstraktive institusjoner») kan komme opp imot eller til og med utkonkurrere nedenfra-og-opp-ordninger når det gjelder å drive frem innovasjon?
Jeg er tilbøyelig til å tro at toppstyrt kontroll hemmer innovasjon, slik Robinson og jeg argumenterte for i Why Nations Fail.
Selv om DeepSeeks suksess ser ut til å utfordre denne påstanden, er den langt fra noe avgjørende bevis på at innovasjon under ekstraktive institusjoner kan være like kraftfull eller like varig som under inkluderende institusjoner. DeepSeek bygger tross alt på mange års fremskritt i USA (og noen i Europa). Alle de grunnleggende metodene ble utviklet der.
Ekspertblandings-modeller og forsterkningslæring ble utviklet i akademiske forskningsinstitusjoner for flere tiår siden, og det var amerikanske Big Tech-selskaper som introduserte transformatormodeller, tankekjede-resonnement og destillasjon.
Det DeepSeek har fått til, er å lykkes som ingeniører ved å kombinere de samme metodene på en mer effektiv måte enn det amerikanske selskaper har gjort. Det gjenstår å se om kinesiske selskaper og forskningsinstitusjoner kan ta det neste skrittet og komme opp med egne banebrytende teknikker, produkter og tilnærminger.
DeepSeek ser dessuten ut til å være ulikt de fleste andre kinesiske KI-selskaper, som vanligvis produserer teknologi for myndighetene eller med statlig finansiering.
Hvis det er slik at selskapet (som ble dannet med grunnlag i et hedgefond) opererte under radaren, vil da kreativiteten og dynamikken fortsette nå som det befinner seg i rampelyset?
Et annet spørsmål handler om geopolitikk.
Uansett hva som skjer, kan ikke ett enkelt selskap brukes som bevis for at Kina er i stand til å vinne over mer åpne samfunn når det gjelder innovasjon.
Et annet spørsmål handler om geopolitikk. Betyr DeepSeek-sagaen at USAs eksportkontroll og andre tiltak for å holde kinesisk KI-forskning tilbake har feilet? Heller ikke her finnes det noe klart svar.
Selv om DeepSeek trente de nyeste modellene sine (V3 og R1) på eldre, mindre kraftige databrikker, trenger de kanskje fortsatt de kraftigste brikkene for å gjøre ytterligere fremskritt og skalere opp.
Ikke desto mindre er det klart at USAs nullsumstilnærming, var ugjennomførbar og uklok. En slik strategi gir bare mening hvis man tror at vi er på vei mot kunstig generell intelligens (KGI, modeller som kan matche mennesker i alle kognitive oppgaver), og at den som kommer først til KGI, vil ha et enormt geopolitisk overtak.
Ved å holde fast ved disse antakelsene – som ikke nødvendigvis er berettigede – har vi forhindret et fruktbart samarbeid med Kina på mange områder.
Det er fortsatt et åpent spørsmål om KGI er oppnåelig på kort sikt.
Hvis et land for eksempel utvikler modeller som øker produktiviteten eller hjelper oss med å regulere energi på en bedre måte, vil en slik innovasjon være gunstig for begge land, særlig hvis den blir mye brukt.
I likhet med sine amerikanske fettere, har DeepSeek ambisjoner om å utvikle KGI, og det å skape en modell som er betydelig billigere å trene opp, kan være en gamechanger. Men å senke utviklingskostnadene med kjente metoder, vil ikke på mirakuløst vis føre oss til KGI i løpet av de nærmeste årene. Det er fortsatt et åpent spørsmål om KGI er oppnåelig på kort sikt (og om det er ønskelig, er enda mer diskutabelt).
Selv om vi ennå ikke kjenner alle detaljene om hvordan DeepSeek utviklet modellene sine, eller hva den tilsynelatende prestasjonen betyr for KI-industriens fremtid, er det én ting som virker opplagt:
En kinesisk oppkomling har punktert teknologibransjens besettelse av skalerbarhet og kanskje til og med ristet bransjen ut av en tilstand av selvtilfredshet.
Oversatt av Astri Tresse
Opphavsrett: Project Syndicate, 2025.
www.project-syndicate.org
Kommentarer