Accueil > Articles & Reviews > [TEST] Architecture Nehalem : Core i7 920 et 965 Extreme
[TEST] Architecture Nehalem : Core i7 920 et 965 Extreme   vu 29789 fois Imprimer Envoyer
Note des utilisateurs: / 105
MauvaisTrès bien 
Écrit par Equipe JMH le Lundi, 03 Novembre 2008 06:00   



1/ ARCHITECTURE NEHALEM 2/2 : SMT, TDP et SpeedStep V2


L’HyperThreading, un retour vers le futur ?

Pour bien comprendre la suite, il faut savoir que le Nehalem est une architecture à 4 cores natifs au contraire des Core 2 Quad qui n'étaient qu'un 'simple' rapprochement de deux Dual Core.

Le Nehalem introduit la notion de "uncore", un terme qui désigne toute partie du processeur qui n'entre pas directement dans le moteur de traitement des instructions. Il faut voir le Nehalem comme une véritable usine de traitement qui se suffit à elle-même. A la différence du Core 2, le Nehalem fonctionne à des fréquences d’horloges différentes et possède un véritable module de générateur de fréquence, un peu comme une gare de triage. Chaque core peut donc tourner à sa fréquence propre, ainsi que toute la partie "uncore" du processeur.

Les cores du Nehalem bénéficient de la technologie SMT (Simultaneous Multi-Threading) apparue avec les Pentium 4 équipés de l'HyperThreading (nom commercial du SMT sur Netburst). Le SMT est une technologie permettant de faciliter la prise en charge de plusieurs threads (= tâches) par une même unité de traitement. Normalement, un core gère de façon successive et aléatoire des morceaux des différents threads dont il a la charge mais cette désorganisation dans le traitement des données n’est pas sans conséquence. En effet, les passages incessants d'un thread à l'autre donnent l'illusion que ceux-ci sont exécutés simultanément mais dans les faits, beaucoup de temps est consacré aux transitions d'un thread à l'autre. L’unité de traitement doit sauvegarder les résultats des calculs du premier thread dont il a la charge et charger les données du second thread pour préparer son traitement et cette manière de procéder n’est ni plus ni moins qu’une perte de temps.

 

SMT Nehalem



Le principe du Simultaneous Multi-Treading est de permettre au core de gérer non plus un mais deux contextes de travail en même temps. Ceci permet ainsi la prise en charge totale et ininterrompue de deux threads sans être obligé de sauvegarder sans cesse les résultats du Thread 1 pour passer à celui du 2 et vice-versa. Les ressources de l’unité de traitement du core (caches, unités d'exécution) sont alors partagées entre les deux threads.

Les plus gros gains de performance de cette technologie sont dus aux opportunités de remplir plus efficacement le pipeline d'exécution. Au final, c’est le rendement du core en lui-même qui est optimisé. Vous verrez dans la suite de l’article (
ici pour les impatients) si cette technologie est réellement bénéfique au Nehalem, car si elle l’a été pour le Pentium 4, c’est déjà beaucoup moins évident pour le Nehalem dont l’architecture de ses pipelines provient directement du Core 2 qui étaient déjà très optimisés dans le domaine…

 

 


TDP et Intel SpeedStep v2

Entre l’optimisation des utilisations des cores (et donc leur rendement) et l’intégration d’un contrôleur mémoire intégré, le Nehalem atteint alors un TDP de 130 W contre 95 W pour ses cousins Yorkfield (Quad Core S775 45 nm) soit environ 35% d’augmentation. Le Nehalem change de tendance, l’économie d’énergie n’étant plus, sur le papier, la priorité d’Intel comme ce fut le cas avec l’architecture résolument puissante et mobile du Core 2. Le core i7 devient un processeur beaucoup plus ''bureautique'' et tout-en-un. Une partie des calories qui était dissipée dans le Nortbridge sera à présent dissipée dans le CPU du fait du contrôleur mémoire intégré. C’est pourquoi il est possible que la version mobile du Nehalem ne possède pas de contrôleur mémoire intégré, en tout cas pas avant un changement de gravure qui puisse permettre cette contrainte thermique. "Wait and see" donc pour la déclinaison portable...

La multiplication des domaines d'horloge et l’affiliation des fréquences et des tensions différentes dans chaque partie du processeur permet cependant (et heureusement) de mieux contrôler la dissipation thermique globale du Nehalem. Du moins d’une manière beaucoup plus efficace que sur Core 2 qui ne souffre pas vraiment d’une dissipation excessive bien au contraire.

Jouant maintenant avec le TDP, l’implémentation du mode Turbo fait beaucoup parler de lui. Ce mode de fonctionnement consiste à accélérer de façon dynamique et temporaire la vitesse d'horloge d'un ou de plusieurs cores lorsque d'autres ne sont pas sollicités. En effet, une grosse partie des applications ne sollicitant pas plus d’un ou deux threads, l'idée consiste alors à augmenter la tension et les fréquences d’horloge du ou des cores utilisés tout en réduisant celles des cores au repos. Ceci est rendu possible à l’aide d’un coefficient supplémentaire (qu'il n’est pas possible de fixer manuellement dans le BIOS dans le cadre d’un i7 920 ou 940) ou de l’ajout de un ou deux QPI supplémentaires. Ainsi la dissipation thermique est volontairement déséquilibrée au sein des cores afin de permettre un overclocking automatique (et donc performances en hausse) tout en restant dans l'enveloppe thermique de 130W de TDP. A noter qu'il existe un "boost" supplémentaire uniquement pour le premier core qui permet de gagner 2 c
oefficients supplémentaires : idéal pour une application "mono-tâche".

Turbo Nehalem



Ce mode turbo sera implémenté également dans les versions mobiles avec des gains en monothread pouvant dépasser les 50% ! Ceci est dû à la possibilité de couper entièrement l’alimentation du core inutilisé et non pas juste le mettre en "sommeil". A noter que le core Extreme i7 965 est le seul Nehalem pour lequel il est possible de "fixer" manuellement le TDP dans le BIOS. Vous pourriez ainsi le fixer à ce qu’est capable de dissiper votre radiateur par exemple…

 

 

Pour conclure, Intel a voulu fortifier son architecture Core 2 là où elle avait le plus de lacunes. En vulgarisant et en prenant des raccourcis, on pourrait dire que le Nehalem est un Core 2 Quad natif avec rendement optimisé de ses cores grâce à l’implémentation du SMT et à l’intégration du contrôleur mémoire DDR3. Le fait de supprimer le vieillissant FSB apporte un nouveau souffle à la montée en puissance de cette architecture empêchant, en théorie, toute limitation de communication de données entre les différentes parties de l’ordinateur.

Bref, c’est un pari qui peut rapporter gros ! Passons maintenant à la suite avec une séance photo suivie du protocole de test et puis des tests tant attendus !


 



PSX le 2008-11-03 à 11:05:22
GG !
Bon il n'y a plus qu'à voir la confirmation du potentiel d'oc du i920 du
commerce. Ca sent le sapin, en dual ou en tri ? Telle est la question.
florian76 le 2008-11-03 à 11:29:22
Quel travail énorme !!!

Bravo trés bon article.

Juste la couleur des
graphes un peu trop terne à mon gout

Good job
CaSSouX le 2008-11-03 à 11:43:36
Excellent test, BRAVO !!!


C'est malin, j'ai presque envi de craquer
Meteorik le 2008-11-03 à 15:19:05
Florian > c'était ça ou du rose gayzou
Benji Tshi le 2008-11-03 à 17:56:00
Go rose Gayzou !

Bel article, surtout la partie théorique (celle
qui m'interessait le plus).
Kerso2004 le 2009-01-22 à 12:51:21
Bonjour à tous,
Premièrement, quel bonheuir de lire ces articles ultra
détillé et qui aide vraiment les novices a choisir leur matériel
en apportant des explications claires et précises  

Par contre,
j'aimerai revenir sur l'influence de la mémoire sur une architecture
Néhalem.  
Voici ce qu'un de vos confrères écrit dans
un article:
"Pour cette première version du Core i7, Intel nous propose un
contrôleur mémoire DDR3 dont la spécificité est de fonctionner non
pas sur deux mais sur trois canaux ! Exit donc le double canal…
bienvenue au triple canal ! Il faudra en clair munir son système de
trois barrettes mémoire DDR3 (ou un multiple de trois) si l'on
souhaite exploiter pleinement la bande passante mémoire gérée par le
processeur. En revanche là où le dernier chipset d'Intel, le X48,
prenait en charge l...
Jmax_oc le 2009-01-25 à 12:13:59
Kerso2004, le gain théorique d'une architecture tri channel par rapport à une
architecture dual channel est de 50%. Or, nos tests (comme les tests de tous
confrères) montrent que le gain pratique est nettement plus limité.
goldorakk le 2010-01-03 à 19:04:03
Salut! Bravo pour ce travail accomplie!
Trés bon résumé, c'est du travail
de pro! Je me suis Procurer Un i7920 et une carte-mere asus P6T Deluxe V2 j'ai
OC ce i7920 @ 3400mhz pour 1.33v(Température en Full 74 degré
celcius)
refroidi a l'air avec un Noctua NH dans un Antec 12 et un Sli de BFG
GTX 280!!

Continuer votre beau travail c'est un plaisir de vous lire!!
Seuls les utilisateurs connectés peuvent écrire un commentaire !
 
Bannière
Plan du site | Partenaires | Contacts | |