MSVP : Le premier ASIC de Meta pour le transcodage vidéo

Meta, anciennement Facebook, a récemment dévoilé son premier accélérateur d'inférence d'intelligence artificielle, le Meta Scalable Video Processor (MSVP). Ce dernier a été conçu pour soutenir les charges de travail en constante évolution de Meta, notamment pour le transcodage vidéo.

MSVP: Meta’s first ASIC for video transcoding
The Meta Scalable Video Processor (MSVP) will support video on demand and live streaming, as well as generative AI and AR/VR content.

Les étapes principales du processus de transcodage

Le MSVP prend en charge une variété de formats de flux vidéo d'entrée, y compris H.264, HEVC, VP9, et AV1. Il effectue des opérations de conversion de format, de superposition vidéo et de rééchantillonnage de trame. Il est également capable de détecter les plans et de supporter les normes de codage H.264 (AVC) et VP9.

Puissance et performance du MSVP

Chaque ASIC MSVP peut offrir une performance de transcodage de pointe de 4K à 15fps à la configuration de qualité la plus élevée avec 1 entrée, 5 sorties de flux et peut monter jusqu'à 4K à 60fps à la configuration de qualité standard. La performance évolue linéairement avec la résolution. Cette performance est atteinte à environ 10W de puissance du module PCIe.

Les algorithmes d'encodage vidéo du MSVP

L'encodeur MSVP a deux objectifs principaux : être très économe en énergie et offrir la même qualité vidéo ou mieux que les encodeurs logiciels. Pour atteindre ces objectifs, Meta a dû trouver des alternatives adaptées au matériel pour chaque module clé de l'encodeur.

Estimation du mouvement

L'estimation du mouvement est l'un des algorithmes les plus intensifs en calcul dans l'encodage vidéo. L'algorithme de recherche de mouvement du MSVP doit identifier quels blocs voisins potentiels peuvent contribuer davantage à la qualité et ne rechercher que parmi les voisins fortement corrélés avec un budget de cycle limité.

Optimisation de la distorsion du débit (RDO)

Pour obtenir une haute qualité d'encodage vidéo, il est également nécessaire de supporter la RDO. Le RDO est l'une des meilleures pratiques en compression vidéo pour déterminer quel mode est optimal compte tenu du débit ou de la qualité cible actuelle.

Quantification intelligente

La quantification est la seule partie de la compression vidéo qui est destructrice, et c'est aussi le principal levier de contrôle du débit dans n'importe quelle norme de codage vidéo. En faisant des choix de quantification intelligents, les bits d'encodage peuvent être alloués aux zones qui ont le plus d'impact sur la qualité visuelle.

H.264 et VP9

Le MSVP prend en charge le codage H.264 et VP9. Pour le H.264, l'algorithme au niveau de la trame peut être configuré pour être à deux passes ou à une passe, en fonction de l'utilisation. Pour le VP9, un passage d'analyse est effectué en amont pour capturer les caractéristiques de la vidéo dans un ensemble de statistiques, qui sont ensuite utilisées pour déterminer les paramètres au niveau de la trame pour le filtrage et l'encodage.

Pour plus d'informations

MSVP : Le premier ASIC de Meta pour le transcodage vidéo

Meta, anciennement Facebook, a récemment dévoilé son premier accélérateur d'inférence d'intelligence artificielle, le Meta Scalable Video Processor (MSVP). Ce dernier a été conçu pour soutenir les charges de travail en constante évolution de Meta, notamment pour le transcodage vidéo.

Les étapes principales du processus de transcodage

Le MSVP prend en charge une variété de formats de flux vidéo d'entrée, y compris H.264, HEVC, VP9, et AV1. Il effectue des opérations de conversion de format, de superposition vidéo et de rééchantillonnage de trame. Il est également capable de détecter les plans et de supporter les normes de codage H.264 (AVC) et VP9.

Puissance et performance du MSVP

Chaque ASIC MSVP peut offrir une performance de transcodage de pointe de 4K à 15fps à la configuration de qualité la plus élevée avec 1 entrée, 5 sorties de flux et peut monter jusqu'à 4K à 60fps à la configuration de qualité standard. La performance évolue linéairement avec la résolution. Cette performance est atteinte à environ 10W de puissance du module PCIe.

Les algorithmes d'encodage vidéo du MSVP

L'encodeur MSVP a deux objectifs principaux : être très économe en énergie et offrir la même qualité vidéo ou mieux que les encodeurs logiciels. Pour atteindre ces objectifs, Meta a dû trouver des alternatives adaptées au matériel pour chaque module clé de l'encodeur.

Estimation du mouvement

L'estimation du mouvement est l'un des algorithmes les plus intensifs en calcul dans l'encodage vidéo. L'algorithme de recherche de mouvement du MSVP doit identifier quels blocs voisins potentiels peuvent contribuer davantage à la qualité et ne rechercher que parmi les voisins fortement corrélés avec un budget de cycle limité.

Optimisation de la distorsion du débit (RDO)

Pour obtenir une haute qualité d'encodage vidéo, il est également nécessaire de supporter la RDO. Le RDO est l'une des meilleures pratiques en compression vidéo pour déterminer quel mode est optimal compte tenu du débit ou de la qualité cible actuelle.

Quantification intelligente

La quantification est la seule partie de la compression vidéo qui est destructrice, et c'est aussi le principal levier de contrôle du débit dans n'importe quelle norme de codage vidéo. En faisant des choix de quantification intelligents, les bits d'encodage peuvent être alloués aux zones qui ont le plus d'impact sur la qualité visuelle.

H.264 et VP9

Le MSVP prend en charge le codage H.264 et VP9. Pour le H.264, l'algorithme au niveau de la trame peut être configuré pour être à deux passes ou à une passe, en fonction de l'utilisation. Pour le VP9, un passage d'analyse est effectué en amont pour capturer les caractéristiques de la vidéo dans un ensemble de statistiques, qui sont ensuite utilisées pour déterminer les paramètres au niveau de la trame pour le filtrage et l'encodage.

Pour plus d'informations

MSVP : Le premier ASIC de Meta pour le transcodage vidéo

Meta, anciennement Facebook, a récemment dévoilé son premier accélérateur d'inférence d'intelligence artificielle, le Meta Scalable Video Processor (MSVP). Ce dernier a été conçu pour soutenir les charges de travail en constante évolution de Meta, notamment pour le transcodage vidéo.

Les étapes principales du processus de transcodage

Le MSVP prend en charge une variété de formats de flux vidéo d'entrée, y compris H.264, HEVC, VP9, et AV1. Il effectue des opérations de conversion de format, de superposition vidéo et de rééchantillonnage de trame. Il est également capable de détecter les plans et de supporter les normes de codage H.264 (AVC) et VP9.

Pour plus d'informations, vous pouvez consulter l'article original sur le blog de Meta.