RÉACTION DU MARCHÉ AUX NOUVELLES DE DEEPSEEK: À LA RECHERCHE DES PROFONDEURS

Que s’est-il passé?

Le marché a réagi très négativement suite à l’annonce d’un nouveau modèle qui aurait coûté seulement 6 millions de dollars à entraîner, utilisant des puces deux générations en arrière, avec des coûts d’inférence projetés à plus de dix fois inférieurs à ceux des modèles d’OpenAI¹.

‒ Raisons de la réaction…cette réaction découle des inquiétudes du marché concernant la future demande en puissance de calcul. S’il est effectivement possible de créer des modèles aussi efficaces que les plus connus (tels que Llama de Meta ou GPT d’OpenAI) en utilisant un matériel moins avancé et des coûts opérationnels considérablement réduits, cela soulève des questions sur la nécessité d’accélérateurs d’IA hautes performances. Cela pourrait finalement entraîner une diminution de la demande pour les équipements de production, ce qui s’est reflété dans la chute des actions d’ASM et d’ASML.

Vue actuelle
La réaction du marché est compréhensible dans un contexte de valorisations élevées, surtout avec l’imminence des résultats trimestriels. Les incertitudes grandissantes entourant la capacité et le délai nécessaires aux grands acteurs technologiques pour récupérer leurs investissements substantiels pèsent sur les esprits. Nous évaluons nos expositions au cas par cas mais considérons globalement qu’il s’agit d’une opportunité pour renforcer certaines positions fondamentalement peu impactées

Estimations des coûts…il n’y a que très peu d’éléments sur l’estimation précise des coûts d’entraînement du modèle de DeepSeek, certaines voix sur le marché mettant en avant que l’entreprise aurait un cluster de 50K H100 de chez Nvidia ce qui porterait l’investissement à plusieurs milliards de $… sans même compter les salaires des ingénieurs travaillant sur le projet, ce chiffre de $6M est pour le moins imprécis².

‒ Types de modèles…la majorité des modèles de DeepSeek sont « distillés » (une méthode de transfert de connaissances d’un modèle large à un modèle plus petit), ce qui implique que le modèle original a probablement nécessité des ressources de calcul significativement plus importantes pour sa construction. La transparence concernant les opérations de l’entreprise reste limitée.

Avantages de l’architecture ouverte…étant donné que DeepSeek opère sur un modèle d’architecture ouverte, les améliorations architecturales apportées par l’entreprise profitent à l’ensemble de l’écosystème, permettant une analyse plus large des avancées que ces modèles offrent. Cela pourrait finalement s’avérer avantageux pour les acteurs logiciels, facilitant l’adoption de la technologie.

‒ La demande de puces……Si l’on prend en compte ces affirmations, cela pourrait réduire la demande en puissance de calcul et, par conséquent, en puces. Toutefois, le paradoxe de Jevons suggère qu’à mesure que l’efficacité des modèles augmente, la consommation globale pourrait également croître. En d’autres termes, ces avancées pourraient favoriser l’adoption par des moyens économiques en abaissant les coûts tant de l’entraînement que de l’inférence. Ainsi, nous ne sommes pas convaincus que la demande de puces s’effondrera ; au contraire, elle pourrait demeurer vigoureuse

Évaluation des risques…historiquement, nous avons considéré que les fournisseurs de modèles de fondation étaient les plus exposés au sein de la chaîne de valeur, en croyant que certains modèles pourraient rapidement devenir des « commodités ». Par conséquent, notre portefeuille est peu exposé à ce segment.

‒ Considérations supplémentaires… Les facteurs géopolitiques ne sauraient être négligés à l’égard de ces annonces. Les entités chinoises pourraient chercher à rééquilibrer les rapports de force en démontrant que les restrictions à l’exportation ont un impact limité sur leur capacité à rivaliser avec les États-Unis dans le domaine de l’intelligence artificielle, notamment en proposant leur modèle en open source (un système collaboratif et décentralisé) alors que la majorité des modèles américains demeurent en closed source (un système propriétaire et monétisé).

En résumé, bien que la réaction du marché repose sur des préoccupations légitimes concernant l’avenir des besoins computationnels et des retours sur investissement, les implications complètes de ces développements nécessiteront une surveillance attentive et une compréhension nuancée.

¹Source : https://www.reuters.com/technology/artificial-intelligence/big-tech-faces-heat-chinas-deepseek-sows-doubts-billion-dollar-spending-2025-01-27/ 
² Source : https://www.reuters.com/technology/artificial-intelligence/what-is-deepseek-why-is-it-disrupting-ai-sector-2025-01-27/

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

error: Content is protected !!