Tidligere i sommer ble det kjent at DeepSeek har valgt å utsette lanseringen av sin nyeste AI-modell R2, etter at toppsjef Liang Wenfeng uttrykte misnøye med modellens ytelser. Egentlig skulle den ha vært lansert i mai.

Financial Times skriver torsdag at forsinkelsen skyldes vedvarende tekniske problemer tilknyttet treningen med Huaweis Ascend-brikker, og viser til tre personer med kjennskap til saken. Ifølge kildene ble DeepSeek oppmuntret av sentrale myndigheter i Beijing til å bruke Huawei-brikker istedenfor Nvidia-brikker etter sin lansering av R1-modellen i januar.

Problemene gjorde at Nvidia-brikker ble brukt til treningen og Huawei-brikker til inferens, der en ferdigtrent modell brukes til å gjøre spådommer og generere svar – som ved et chatbot-spørsmål.

– Kina ligger fortsatt bak USA

Avisen mener DeepSeeks problemer illustrerer at kinesiske brikker fremdeles ligger bak sine amerikanske konkurrenter – spesielt Nvidia – i løsningen av kritiske oppgaver, og belyser utfordringene Kina står overfor i forsøket på å bli teknologisk selvforsynt.

Financial Times skrev denne uken at Beijing krever begrunnelse fra kinesiske selskaper som bestiller Nvidias H20-brikke, for å oppmuntre til bruk av alternativer produsert av Huawei og Cambricon.

Bransjeinnsidere har hevdet at kinesiske brikker sliter med stabilitet, kommuniserer tregere og har dårligere programvare sammenlignet med Nvidias produkter.

Ingeniører kunne ikke hjelpe

To av avisens kilder opplyser at Huawei sendte et ingeniørteam til DeepSeek for å hjelpe med utviklingen av R2-modellen, men en vellykket treningsrunde med Ascend-brikken lot seg likevel ikke gjøre. Arbeidet med å gjøre modellen kompatibel med brikken (for inferens) skal fortsatt pågå.

Ifølge en annen kilde henger R2-forsinkelsen også sammen med at datamerking for den oppdaterte modellen har tatt lenger tid enn ventet. Kinesiske medier har antydet en lansering allerede i løpet av de neste ukene.

– Modeller er råvarer som lett kan byttes ut. Mange utviklere bruker Alibabas kraftige og fleksible Qwen3, sier AI-forsker Ritwik Gupta ved University of California, Berkeley.

– Voksesmerter vil gå over

Forskeren påpeker overfor Financial Times at Qwen3 har tatt i bruk DeepSeeks kjernekonsepter – eksempelvis treningsalgoritmen som gjør modellen i stand til å resonnere, men gjort dem mer effektive.

Han spår at Huawei vil komme over det han kaller «voksesmerter.»

– Bare fordi vi ikke ser ledende modeller trent på Huawei i dag, betyr ikke det at det ikke vil skje i fremtiden. Det er bare et spørsmål om tid, sier Gupta.