C’est une tendance qui se constate presque systématiquement quand une nouvelle technologie se développe et prétend apporter une petite révolution au monde du jeu vidéo : le matériel donnant accès à cette technologie est lancé en premier sur le marché, et il faut ensuite attendre plusieurs mois, voire années, avant que ne sortent les premiers jeux l’exploitant. Les SSD NVMe au standard PCIe Gen 5 n’y font pas exception, et c’est bien ce que nous vous disions il y a trois mois dans notre preview du Crucial T700 : l’intérêt pour le jeu de ce dernier n’allait pouvoir se révéler qu’une fois que seraient disponibles les premiers vrais titres DirectStorage – dont Forspoken est exclu, puisqu’il n’utilise qu’une portion congrue des fonctionnalités offertes par la nouvelle API de Windows. Et voilà que cet été, une réponse a été apportée à notre requête, avec la sortie d’abord de la démo technique Portal: Prelude RTX, puis surtout de la version PC de Ratchet & Clank: Rift Apart.
Ratchet & Clank: Rift Apart (© Sony Interactive Entertainment)
Portal: Prelude RTX (© Nicolas Grevet, David Driver-Gomm)
Il est à la fois remarquable, et en même temps pas vraiment surprenant, que dans l’exploration de cette nouvelle technologie PC, le pionnier soit le portage d’un jeu à l’ADN résolument consoleux et originellement développé comme une exclusivité console. Après tout, ce sont justement les consoles, et en particulier la PlayStation 5, qui ont lancé en 2020 la discussion sur le rôle que le stockage allait potentiellement avoir sur la nouvelle génération de jeux. Pour ces machines, la révolution était déjà bien sûr qu’elles soient équipées de série d’un SSD, plutôt que les bons vieux disques durs à plateaux que se traînaient les différents modèles de PS4 et de Xbox One. Mais c’est aussi un domaine sur lesquels elles ont pu jouer avec le gros avantage qu’une plateforme console aura toujours par rapport au PC : une configuration hardware fixe, qui autorise le déploiement de principes de design inédits, et nullement contraints par le besoin de répondre à un standard établi.

Console en tête.

Certes, à propos de la PS5 en particulier, on a pu vanter un SSD interne dont les débits bruts (5,5 Go/s en lecture séquentielle) étaient à l’époque dignes des SSD pour PC les plus rapides disponibles dans le commerce. L’affirmation n’a évidemment pas tenu longtemps, puisque sont très vites arrivés de nouveaux modèles encore bien plus rapides que cela. Qu’importe, la vraie force de la machine de Sony n’était en fait pas là, mais surtout dans le fait que le SSD y était accompagné de composants matériels custom ayant pour but de rendre cette vitesse brute réellement exploitable.

L'architecture d'entrées/sorties de la PS5, telle que présentée par Mark Cerny en mars 2020. (© Sony Interactive Entertainment)
La raison d’être de ces composants, c’est justement notre expérience en tant que joueur PC qui nous la donne : sur nos machines où les SSD sont devenus monnaie courante depuis près de dix ans, il est devenu une vérité universellement connue que dans les jeux, une fois un certain palier de débit franchi (palier généralement extrêmement modeste pour de la mémoire flash), on n’obtenait plus de gains significatifs dans les temps de chargement, ni quelque autre métrique de performances, en passant sur un stockage encore plus rapide. Les goulets d’étranglement sont ailleurs : ils se situent généralement au niveau du processeur central, lui qui est chargé de traiter toutes les données en provenance du stockage, mais ne peut pas le faire à une vitesse illimitée.
Et le rôle du hardware custom est donc précisément de supprimer ces goulets d’étranglement. Son rôle se décompose, à haut niveau, en deux tâches principales. Du silicium est dédié à la décompression des données en provenance de la flash – une opération avec laquelle le CPU pourrait autrement se trouver très rapidement débordé si les données en question lui arrivent à un rythme trop soutenu. Par ailleurs, le contrôleur d’entrée/sortie est optimisé pour être capable de diriger les données vers les bonnes adresses mémoire à un rythme aussi élevé que possible, et surtout les pointer directement vers la mémoire vidéo, supprimant donc là encore une étape au niveau du CPU. Précisons bien que même si l’on a pris jusqu’à maintenant la PS5 en exemple (en premier lieu bien sûr parce que c’est la plateforme d’origine de Ratchet & Clank), toutes ces dispositions sont également présentes sur Xbox Series X/S, simplement dans des variantes un peu moins évoluées puisque le SSD équipant ces dernières est sensiblement moins rapide – ce qui n’a pas empêché Microsoft de donner à tout cela le nom ronflant de Xbox Velocity Architecture.

GPU à tout faire.

Et pour ce qui est du PC alors ? C’est là qu’entre en jeu DirectStorage, une interface de programmation intégrée dans DirectX 12 Ultimate, permettant des fonctionnalités similaires dans Windows. Similaires mais pas identiques, car il faut cette fois composer avec l’impossibilité de chambouler une architecture matérielle totalement standardisée. Les différences ne sont toutefois qu’anecdotiques, quand elles ne sont pas carrément insignifiantes. Ainsi en va-t-il de la possibilité pour le GPU d’aller piocher des données dans la mémoire système pour les copier directement sur la mémoire vidéo : le chemin n’est pas tout à fait aussi optimal que pour les consoles avec leur pool mémoire unifié, mais le CPU est toujours contourné, et cela suffit largement à refaire du SSD l’élément limitant sur toute la chaîne de transmission de données – sur le papier bien sûr.

Quant à la décompression des données, depuis la version 1.1 de DirectStorage lancée en novembre 2022 (en septembre 2023, nous en sommes à la version 1.2), elle peut elle aussi être déchargée du CPU, pour prendre place plutôt sur le processeur graphique. Forcément, l’économie de ressources de calcul n’est pas aussi parfaite que si la tâche était confiée à une puce spécialisée. Mais il n’empêche que l’on gagne quand même beaucoup au change. Si jamais les opérations de décompression doivent amener à une saturation du GPU, l’impact sur les performances est beaucoup moins grave que dans le cas d’une saturation des ressources CPU : d’un côté quelques images par seconde en moins le temps que l’opération se termine, de l’autre des interruptions de processus et donc des saccades assez violentes (ou, comme on dit plus communément, du stuttering). Qui plus est, la décompression de données est une tâche dans laquelle les innombrables unités de calcul d’un GPU peuvent être bien plus efficaces qu’un CPU. Et ce sera d’autant plus vrai si le jeu choisit d’utiliser le format de compression GDeflate, développé spécifiquement pour l’intégration avec DirectStorage, et pour exploiter au mieux les capacités de calculs parallèles homériques d’un processeur graphique (le développement a été mené par Microsoft et Nvidia, mais pas de panique : il s’agit d’un standard ouvert et compatible avec toutes les architectures GPU existantes).
Schéma de fonctionnement de DirectStorage 1.1/1.2. (© Microsoft)
Le gain de débit de décompression en utilisant GDeflate sur un GPU, d'après Nvidia. (© Nvidia)

Pour la vitesse, faut pas être pressé.

Toute cette théorie est bien jolie, mais la pratique, ça donne quoi ? Il faut tout de suite tempérer les attentes quant à la réponse à cette question. Même sur les consoles, près de trois ans après leur lancement, il n’y a encore que très peu de jeux que l’on a vus exploiter de façon concrète et tangible les nouvelles possibilités ouvertes par ces infrastructures de stockage. La réalité du développement de jeux aujourd’hui reste ce qu’elle est, avec les contraintes des développements multiplateformes ou cross-gen qui n’encouragent pas à utiliser des fonctionnalités qui ne soient pas disponibles partout. De même, des cycles de développement extrêmement longs font que les titres à forte ambition technique dont la production a été lancée assez tard, sans pouvoir intégrer profondément ces technologies, sont encore bien loin de leur achèvement. À tout cela, la seule exception remarquable est… Ratchet & Clank: Rift Apart, mais on y reviendra.

Toujours est-il que la disponibilité de Ratchet et de Portal: Prelude RTX nous permet au moins de nous lancer dans quelques nouvelles expériences, notamment de vérifier une nouvelle fois si le débit brut du stockage fait une différence concrète dans l’expérience de jeu. Au passage, il est à noter qu’un SSD NVMe est obligatoire pour avoir accès à l’intégralité des fonctions de DirectStorage, mais qu’un bon nombre d’entre elles restent actives sur d'autres types de stockage. C’est pourquoi, en plus de nos tests sur des SSD NVMe allant du Crucial T700 dernier cri en PCIe 5 (12,4 Go/s en lecture séquentielle) au WD Blue SN550 en PCIe 3 (2,5 Go/s), nous avons aussi inclus dans l’opération le SSD externe Lexar Blaze SL660, assurant 2 Go/s sur une connexion USB-C 20 Gb/s (ou USB 3.2 Gen 2×2 pour les amateurs de nomenclatures cryptiques indigestes).
Le SSD externe Lexar Blaze SL660.
On passe rapidement sur le cas de la démo Portal, qui ne fait franchement pas l’usage le plus spectaculaire qui soit de la chose. Comme si elle ne voulait que démontrer artificiellement le gain apporté par DirectStorage et GDeflate, elle fait simplement le choix, à chaque chargement d’une nouvelle salle, de mettre fin à l’écran de chargement avant que les versions haute définition des textures soient mises en mémoire. Elle nous donne ainsi à voir l’apparition successive des mipmaps successives, qui se conclut en 2,5 secondes sans DirectStorage et en un peu moins d’une seconde avec. On ne peut pas dire que ça nous change la vie. Oh, et ça fonctionne avec absolument tous nos SSD, y compris le Lexar USB, sans aucune différence de temps de chargement mesurable.

Promesses pas encore tenues.

Le cas de Ratchet & Clank est a priori bien plus intéressant, car c’est bien lui qui, dès mars 2021, s’est imposé comme le grand démonstrateur de ce que peut faire le SSD de la PS5, grâce à ses portails dimensionnels téléportant le joueur quasi instantanément d’un environnement ultra détaillé à un autre – le tout sans même passer par un écran de chargement, seulement une animation de transition longue d’à peine une seconde. Le jeu d’Insomniac Games est disponible sur PC depuis le 26 juillet 2023, par l’intermédiaire d’un portage réalisé par le studio néerlandais spécialisé Nixxes. Est-ce enfin le moment où l’on va voir des différences entre tous nos SSD de test ? La réponse est non. Que ce soit avec notre modèle PCIe 5 ou avec le SSD externe, impossible de constater une variation discernable dans la durée des transitions. Rien à faire : le seuil à partir duquel le gain de performance ne se voit plus est certes légèrement rehaussé par rapport à ce qui était habituel auparavant (sur un SSD SATA à 500 Mo/s, on voit cette fois un significatif ralentissement des chargements), mais il reste très bas.

Même avec DirectStorage 1.2 sur une config à base de RTX 4090 et Ryzen 9 7950X3D, les téléportations dans Ratchet causent toujours des saccades assez brutales. (© Sony Interactive Entertainment)
Évidemment, on ne peut écarter ici la possibilité qu'un simple souci d’optimisation du code PC qui soit responsable de cela. C’est même probable en vérité, car la rapidité du chargement dépend en revanche toujours beaucoup du matériel entourant le SSD, à un degré assez hautement contradictoire avec les promesses de DirectStorage. En particulier, on voit toujours très clairement dans les chargements des moments d’interruption qui portent toutes les marques d’une saturation CPU passagère. Le problème est évidemment plus prononcé sur les processeurs modestes, mais nous l’avons constaté même sur les processeurs les plus rapides du moment, Intel Core i9-13900KF comme AMD Ryzen 9 7950X3D (il est d’ailleurs sensiblement plus prononcé avec les processeurs AMD, soit dit en passant). Le GPU, quant à lui, ne semble avoir strictement aucun impact. Quel que soit le matériel utilisé, il est en tout cas impossible d’obtenir des transitions aussi fluides que sur PS5… et ce alors même que sur PS5, on ne voit aucune dégradation en installant le jeu sur un SSD M.2 plus lent que le SSD interne de la console.

En attendant que ça change.

De tout cela, on ne peut tirer qu'une seule conclusion : il est encore bien trop tôt pour tirer des conclusions. Encore aujourd’hui, la vitesse brute des SSD ne s’est toujours pas hissée parmi les points de données importants à prendre en compte pour les performances globales d’une machine de jeu. Peut-être bien qu’à terme, on se rendra compte que ce sont d’autres spécifications qui se révèleront critiques, comme le nombre d’opérations par seconde – mais rien ne peut encore s’observer concrètement pour le moment. Le mot de la fin ne peut donc qu’être une paraphrase de celui qu’on vous avait déjà servi il y a trois mois : à l’heure qu’il est, les joueurs n’ont strictement aucun intérêt à se pencher sur les nouveaux SSD PCIe 5 qui fleurissent sur les étalages des revendeurs ; car d’ici à ce qu’ils trouvent (un jour peut-être) leur raison d’être, les prix auront probablement eu le temps de baisser drastiquement. Tout ça pour ça, ça valait bien le coup !