Жалаңаш өнімділік - Біз ALU және FPU тиімділігін зерттейміз. Өнімділікті тексеру Компьютердегі fpu дегеніміз не

    AIDA64EXTREME

    Лицензия түрі:

    Шакылды

    Тілдер:

    Windows 8, 8 64-бит, 7, 7 64-бит, Vista, Vista 64-бит, XP, XP 64-бит

    Жүктеп алынды:

Өнімділік сынағы

AIDA64 жабдықтың жекелеген бөліктерінің өнімділігін анықтау үшін пайдаланылатын бірнеше сынақтардың болуын болжайды толық жүйежалпы. Мұндай сынақтар жүйенің теориялық ең жоғары өнімділігін бағалауға қабілетті синтетикалық деп жіктеледі. Жад өткізу қабілеттілігінің өзін тексеру орталық процессорнемесе FPU қондырғылары бір уақытта 640 өңдеу ағындарына, сондай-ақ ондаған процессорлар тобына қолдау көрсете алатын AIDA64 тестілеу жүйесіне негізделген. Қолдау гипертрейдингтік және көп ядролы технологияларға, сондай-ақ мультипроцессорларға - SMP көрсетіледі.

AIDA64 жүйесі жеке сынақтар арқылы бағалауды жүзеге асыруға мүмкіндік береді өткізу қабілетіоқу, жазу, көшіру және кэшті тежеу. Мұның бәрі жад құрылғыларының өнімділігін бағалауға мүмкіндік беретін сынақ модулімен, атап айтқанда қатты дискілер(S)ATA немесе SCSI, SSD дискілері, RAID массивтері, жад карталары, оптикалық дискілер, және USB дискілері.

GPGPU өнімділігінің сапасын тексеру

Бұл сынақ тақтасында OpenCL GPGPU сынақтарының жиынтығы бар. Бұл функцияға Service/GPGPU Test бөлімінде қол жеткізуге болады. Олардың арқасында есептеу өнімділігі әртүрлі OpenCL жұмыс жүктемелері арқылы бағаланады. Әрбір жеке сынақты NVIDIA, AMD және Intel процессорларын немесе олардың комбинациясын қоса алғанда, 16 графикалық процессорларда іске қосуға болады. Әрине, CrossFire, SLI, APU және dGPU конфигурацияларына толық қолдау көрсетіледі. Жалпы, бұл функция кез келген өнімділік деңгейін анықтауға мүмкіндік береді компьютерлік технологияретінде берілген GPU OpenCL құрылғылары.

AIDA64 тек күрделі сынақтарды ғана емес, сонымен қатар «Тесттер» / «Бет» бөлімдерінде қолжетімді микротесттерді де жүргізеді. Арқасында толық базаБұл көрсеткіштерді басқа конфигурациялар үшін ұқсас көрсеткіштермен салыстыруға болады.

Жад өнімділігі деңгейлерін тексеру

Мұндай сынақтар оқу, жазу және көшіру сияқты тапсырмалар үшін ең жоғары өткізу қабілетін бағалауды ұсынады. Ассемблер тілінде жазылған және ең танымал процессорлар - VIA, AMD және Intel үшін оңтайландырылған. Мұнда кеңейтілген пәрмен жиындары пайдаланылады: SSE, SSE2, SSE4.1, 8x86/x64, x87, 3DNow!, MMX, MMX+ және AVX, AVX2.

Сонымен қатар, сынақ процессордың жүйелік жадтан деректерді оқуына байланысты пайда болатын жадтың кешігуін бағалауға мүмкіндік береді. Жадтың кешігуі – оқу пәрмені берілгеннен кейін процессордың бүтін арифметикалық регистрінде деректер тасымалданатын уақыт.

CPU Queen Integer сынағы

Бұл қарапайым сынақ процессор тармақтарының болжамдарының қалай орындалатынын және салалық болжамдардың қате болжанбағанын бағалайды. Шешімдер 10х10 шахмат тақтасында орналасқан 8 ханшайымы бар басқатырғышқа арналған. Теорияны назарға алайық: егер тактілік жиілік бірдей болса, тармақты қате болжау нәтижесінде қысқа құбыры бар және үстеме шығындар деңгейі төмен процессор көрсете алады. жоғарғы ұпайларсынақ. Мысалы, гипертреадингті өшіру арқылы Intel Northwood негізіндегі Pentium 4 Intel Prescott-тен жоғары ұпай жинайды. Себебі бірінші процессорда 20 сатылы құбыр болса, екіншісінде 31 сатылы құбыр бар. Бүтін CPU Queen оңтайландырулары - MMX, SSE2, SSSE3.

CPU PhotoWorxx

Ұсынылған бүтін сандық тест екі өлшемді фотосуреттерді өңдеу алгоритмдеріне негізделген процессордың өнімділігін анықтауға мүмкіндік береді. Өте үлкен RGB кескіндерімен мыналар орын алады:

  • суретті кездейсоқ таңдалған түспен пикселдермен толтыру;
  • суретті сағат тіліне қарсы 90 градусқа бұру;
  • кескінді 180 градусқа бұру;
  • кескінді дифференциациялау;
  • түс кеңістігін түрлендіру, мысалы, JPEG пішімін түрлендіру кезінде пайдалануға болады.

Сынақ негізінен негізгі процессордың SIMD архитектурасының арифметикалық блоктарына және қолданыстағы жадының ішкі жүйелеріне арналған. PhotoWorxx CPU нұсқау жиынтықтарының келесі кеңейтімдері бар: x87, MMX, MMX+, AVX, AVX2, 3DNow!, 3DNow!+, SSE, SSE2, SSSE3, SSE4.1, SSE4A, сондай-ақ NUMA, мультипроцессорлар (SMP), гипертреадингті қолдайды. және көп ядролы (CMP).

CPU ZLib

Ұсынылған бүтін санды тест ZLib деректерді қысу арқасында негізгі процессор мен жад ішкі жүйесінің өнімділігін біріктірілген бағалауды қамтамасыз етеді. Нұсқаулар негізгі x86-ны қолданады, бірақ гипертрейдинг, мультипроцессорлар (SMP) және көп ядролы (CMP) қолдайды.

CPU AES

Ұсынылған бүтін сандық тест AES криптографиялық алгоритмін (симметриялық блокты шифрлау алгоритмі) пайдаланып шифрлауды орындау кезінде негізгі процессордың жұмысын бағалайды. Бүгінгі таңда AES бірнеше қысу құралдарында қолданылады: 7z, RAR, WinZip. Олар сонымен қатар TrueCrypt, BitLocker, FileVault (Mac OS X) бағдарламалық қамтамасыз етуді шифрлауда қолданылады. Нұсқаулар келесідей: x86, MMX және SSE4.1. Жүйе VIA PadLock Security Engine қолдау технологиялары бар VIA C3, C7, Nano және QuadCore процессорларында жеделдетілген аппараттық құрал болып табылады. Intel AES-NI нұсқаулар жинағы бар процессорларға да қолданылады. Гипертрейдинг, мультипроцессорлар (SMP) және көп ядролы (CMP) үшін қолдау бар.

CPU хэш

Бұл бүтін сан сынағы 180-4 Федералды деректерді өңдеу стандартына сәйкес SHA1 кэштеу алгоритмі арқылы CPU өнімділігін өлшейді. Код ассемблер тілінде жазылған және SSE2, SSSE3, MMX, MMX+/SSE, AVX, AVX2, XOP, BMI және келесі пәрмендер жинағын пайдалануды ескере отырып, AMD, Intel және VIA негізгі ядролары үшін оңтайландырылған. BMI2. CPUHash сынағы – VIA PadLock Security Engine технологиясын пайдалана алатын VIA C7, VIA Nano және VIA QuadCore процессорларында жеделдетілген аппараттық құрал.

FPU VP8

Бұл сынақ Google VP8 (WebM) кодек 1.1.0 нұсқасы арқылы бейне қысуды талдайды. Кодтау 1280x720 кеңейтімі бар және 8192 кбит/с жылдамдықпен жұмыс істейтін бейне ағынының 1 өтуінде жүзеге асырылады (максималды конфигурацияланған сапаны ескере отырып). Жақтау компоненттері Julia FPU фракталдық модулі арқылы жасалады. Мұнда келесі кеңейтімдер мен пәрмен жиындары пайдаланылады: MMX, SSE2, SSSE3 немесе SSE4.1. Ол сонымен қатар мультипроцессорларды (SMP), көп ядроларды (CMP) және гипертрансляцияны қолдайды.

ФПУ Юлия

Бұл сынақ 32 биттік жүйедегі бір дәлдіктегі (қалқымалы жиілік) әрекеттердің өнімділігін бағалайды. Джулия фракталының бірнеше бөліктері есептелді. Олар келесі нұсқаулар жинағын пайдалана отырып, AMD, Intel және VIA ядролары үшін қолайлы бір тілді пайдаланады: x87, 3DNow!, 3DNow!+, SSE, AVX, AVX2, FMA және FMA4. Қолдау ұқсас.

FPU Mandel

64 биттік дәлдікке арналған қос дәлдіктегі өзгермелі нүкте әрекеттері FPUMandel көмегімен тексеріледі. Мандельброт фракталының бөліктерін модельдеу жүргізіледі. Тілі бір, процессорлары бірдей, қолдауы бұрынғы сынақтардағыдай. Пәрмендер жинағы: FMA және FMA4, x87, SSE2, AVX, AVX2,

ФПУ СинДжулия

Сынақ операцияларды бағалайды жоғары дәлдікөзгермелі нүкте (80 биттік жүйе). Джулия фракталы (өзгертілген) көмегімен түсірілген әрбір кадр үшін есептеулер жүргізіледі. Тіл - алдыңғы нұсқалардағыдай, ядролар бірдей, x87 архитектурасының тригонометриялық және экспоненциалды нұсқауларын пайдалану. Гиперағынды, көп ядролы (CMP) және көп процессорлы (SMP) қолдайды.

08.08.2012

Процессорлар пайда болғанға дейін Intel Core«Негізгі тиімділік» тұжырымдамасы туралы ешкім ойлаған жоқ, бірақ оның мәні бұрын мақталған жиіліктер мен кэш өлшемдерінен әлдеқайда жоғары болып шықты. Бірақ ядроның тиімділігін сандармен қалай көрсете аламыз? Біз сізге өнімділікті басқа қырынан бағалауға болатын опциялардың бірін ұсынамыз.

Бүгінгі сынақтың нәтижелері түпкілікті шындықты білдірмейтінін бірден ескертемін. Және ол 100% дәл деп мәлімдемейді. Егер сіз басқа тестілеу принциптерін қолдансаңыз, сіз әртүрлі нәтижелерге қол жеткізе аласыз, бірақ маған солай көрінеді бұл әдістарихпен расталған адекватты қорытындылар жасауға мүмкіндік береді.

Белгілі бір процессорды тиісті өнімділікті көрсетуге не мәжбүр етеді? Бұл сұрақ темір әлемінің көптеген әуесқойлары мен кәсіпқойларын азаптады. Ұзақ уақыт бойы өнімділіктің негізгі өлшемі сағат жылдамдығы болды. Біраз уақыттан кейін назар алдыңғы автобустың жиілігіне, содан кейін кэштердің көлеміне, содан кейін ядролардың санына ауысты. Бірақ есептеулердің жылдамдығына тікелей әсер ететін бір нәрсе әрқашан назардан тыс қалды.

Бұл, сөзсіз, заманауи x86 процессорларының екі маңызды бірлігінің таза өнімділігі: бүтін бірлік (ALU - арифметикалық логикалық бірлік) және өзгермелі нүктелі бірлік (FPU - қалқымалы нүкте бірлігі). Дәл олардың сипаттамаларының ортақтығы архитектура түсінігін анықтайды - және бұл тұжырымдаманың кэшке немесе жиілікке ешқандай қатысы жоқ, сонымен бірге ол процессордың жалпы өнімділігіне тікелей әсер етеді.

Сонымен, біз үлкен зерттеуді бастамас бұрын, бұл блоктардың не екенін, олар не істейтінін және қалай жұмыс істейтінін анықтап алайық. Жоғарыда айтқанымдай, бұл материал жадпен, кэштермен және басқа толықтырулармен жұмыс істеу туралы сөйлеспейді, біз тек ALU және FPU туралы, және, әрине, олардың екі маңызды құрамдас бөлігі - құбырлар және салалық болжау блогы туралы сөйлесеміз. Ал, Intel компаниясының Hyper-Threading технологиясы туралы аздап сөйлесейік, өйткені ол қарапайым операцияларды орындау кезінде ядроның өнімділігіне тікелей әсер етеді.

Бүтін операциялар блогы

Процессордың бірінші және негізгі блогы. Дегенмен, блок емес, блоктар деп айту дұрысырақ болар еді, өйткені процессорларда олардың бірнешеуі бар. Бір сөзбен айтқанда, дамудың басында процессорда бұл блоктан басқа ештеңе болған жоқ. Алғашқы үлгілерден бастап бүгінгі құбыжықтарға дейін ALU негізгі миссиясы өзгерген жоқ. Ол әлі де жай (бүтін) сандармен жұмыс істейді, қосу, алу, салыстыру, сандарды түрлендіру амалдарын орындайды; қарапайым логикалық операцияларды, сондай-ақ разрядты ауыстыруды орындайды.

Назар аударыңыз, ALU-ға көбейту және бөлу тапсырмалары берілмейді, өйткені бұл есептеулер өте сирек кездеседі және нәтижесінде оларға өздерінің жеке блогы - «бүтін көбейткіш» бөлінген, соның арқасында оны көбейтуге болады. ALU өнімділігі, оны стандартты емес тапсырмалардан босатады. Бөлу амалдары көбейткішке де тағайындалады және тұрақты шамалардың арнайы кестесі арқылы орындалады. Міне, өте қарапайым блок, оның өнімділігі көптеген тапсырмаларда процессордың өнімділігіне тікелей әсер етеді, мысалы, кеңсе қосымшалары, есептеулерге арналған көптеген арнайы бағдарламалар және т.б.

Жылжымалы нүкте бірлігі

Бұл блок процессорларда ALU-ға қарағанда әлдеқайда кейінірек пайда болды және бастапқыда ол тіпті сопроцессор ретінде қарастырылды. Алайда, кейінірек ол негізгі процессордың өзегіне көшті және содан бері оның ажырамас және өте маңызды бөлігі болды (ALU-дағы жағдай, бұл блок процессорда жалғыз емес). Өзінің аты айтып тұрғандай, FPU-ның негізгі міндеті - нақты өзгермелі нүкте сандарымен операциялар.

Бұл блок орталық процессордың бөлігі ретінде пайда болғандықтан, оған жүктеме үнемі өсіп отырды, бұл ақыр соңында FPU жүктемесінің ALU жүктемесінен асып кетуіне әкелді. Сонымен қатар, бұл блоктың жоғары әмбебаптығын ескере отырып, оған қосымша функциялар біртіндеп «ілінді», атап айтқанда осы сәтол барлық ағындық рұқсаттармен жұмыс істейді және векторлық деректерді өңдейді, олардың қазіргі заманғы процессорларында көп. Қолданбалардың басым көпшілігінде, әсіресе мультимедиялық, ойындарда, фотосуреттермен 3D жұмысында және т.б. процессордың өнімділігі осы блоктың өнімділігіне байланысты.

Конвейер

Процессордағы әрбір операция белгілі бір өңдеу уақытын қажет ететіні белгілі және бұл деректер, асыра айтпағанда, орасан зор сома болып табылады. Олармен жұмысты оңтайландыру және олардың орындалуын оңтайландыру, жұмыс жылдамдығын арттыру үшін конвейер ойлап табылды.

Оның принципі зауыттағы кәдімгі конвейер лентасының жұмысына ұқсас: бөлшек оны өңдейтін жұмысшылардың бірнеше стационарлық станцияларынан бірте-бірте өтеді және әрқайсысы оған бір ғана операция жасайды. Бөлшектің орнына процессор мәліметтерді қамтиды, олар да бірнеше кезеңдерден кезекпен өтеді. Әрине, бұл тәсіл әрбір жеке процессор блогының бос тұру уақытын едәуір қысқартуға, яғни деректерді эксклюзивті өңдеумен салыстырғанда оның өнімділігін айтарлықтай арттыруға мүмкіндік берді.

Дегенмен, конвейердің артықшылықтарының салдары болып табылатын кемшіліктері де бар. Ең бастысы - бағдарлама ағынының күтпеген өзгеруіне байланысты бүкіл құбырды қалпына келтіру қажеттілігі. Көбінесе бұл кодта шартты мәлімдемелер пайдаланылған кезде орын алады, олар шарттарға байланысты әрі қарай деректер мен жолдарды өзгертеді.

Тағы біреуі бар маңызды нүкте: Әртүрлі процессорлардың құбыр желілерінде кезеңдердің әртүрлі саны бар. Қысқа құбырлардың артықшылығы - олар бірдей жиілікте жоғары өнімділікке қол жеткізуге мүмкіндік береді, ал ұзын құбыр жоғары тактілік жылдамдықтарға қол жеткізуге көмектеседі. Қарапайым өмірлік мысал: бір кездері NetBurst архитектурасы бар Intel Pentium 4 процессорларымен бәсекеге түскен, сәйкесінше K7 және K8 архитектурасы бар AMD Athlon XP және Athlon 64 процессорлары. Естеріңізде болса керек, бұл жолдардағы көптеген процессорлар өнімділік бойынша бір-біріне өте жақын болды, бірақ сонымен бірге олар сипаттамалары бойынша түбегейлі ерекшеленеді. Атап айтқанда, Athlon 64 3200+ бар сағат жиілігі 2200 мегагерц, жиілігі 3200 мегагерц Pentium 4-тен асып түсті. Бұл фактінің себебі - құбырдың әртүрлі ұзындығы: егер AMD дәстүрлі түрде қысқа 12 кезеңді пайдаланса, Pentium 4-тегі Intel әлдеқайда ұзағырақ 20 кезеңді, ал сәл кейінірек - 31 кезеңді пайдаланды! Демек, өнімділіктегі айтарлықтай айырмашылық.

Тармақ болжау блогы (шартты тармақты болжау блогы)

Бұл блоктың пайда болуы конвейер пайда болғаннан кейін сөзсіз болды. Қазірдің өзінде жарияланған шартты мәлімдемелер мәселесі және құбырдың сөзсіз толық қалпына келтірілуі жалпы өнімділікке айтарлықтай әсер етті, өйткені кейбір қолданбаларда деректерді өңдеу кезінде ақаулардың пайызы жай ғана масштабтан шығып кетті.

Сонымен, бұл блок не істейді? Қарапайым - ол процессордың кәдімгі көріпкелі ретінде жұмыс істейді, яғни оқиғалардан асып түсу арқылы (қате деректер тармағының есептеулерін оқыңыз), ол шартты ауысудың орындалатынын немесе орындалмайтынын анықтайды. Әрине, кофе ұнтағында сәуегейлік болмайды. Қазіргі уақытта негізгі және басымдық ауысуларды болжаудың динамикалық әдісі болып табылады, онда салалық болжау блогы процессор өңдеуге дайындалатын деректер мен нұсқауларды талдап қана қоймайды, сонымен қатар өзі жасайтын ұқсас ауысулардың тарихын талдайды. жинақталады. Ол түпкілікті нәтижені (дұрыс тапты ма, жоқ па) үнемі қадағалап отыруына және оны өз болжамымен салыстыруға, өзінің жеке статистикасын толықтыруға байланысты, болашақта ұқсас жағдайларда болжау тиімділігі айтарлықтай артады. Осы тактиканың арқасында бұл блокта қателерге қарағанда әлдеқайда дұрыс болжамдар бар - Intel және AMD заманауи процессорлары 95-97 жағдайда шартты өту бағытын дұрыс анықтайды. Әрине, осының арқасында конвейер салыстырмалы түрде сирек қалпына келтіріледі.

Сіз процессорлар бойынша аздап білім алдыңыз, енді біз оның шын мәнінде қалай жұмыс істейтінін, осы немесе басқа архитектураның қаншалықты тиімді екенін және ALU және FPU қондырғыларының (және, әрине, олардың қосалқы бөліктері) қаншалықты тиімді екенін қарастырамыз. Процессор өзектерінің мүмкіндігінше кең ауқымын қамту және сонымен бірге кэш, процессор шинасы және жад ішкі жүйесінің өткізу қабілеттілігі сияқты заманауи процессорлардың маңызды бөліктерінің сынақ нәтижелеріне әсерін азайту үшін біз AIDA 64-ке жүгіндік. Сонымен қатар, пакеттік сынақтан тек екі синтетикалық пакет таңдалды - CPU Queen және FPU SinJulia. Неліктен олар? Жауап олардың жұмыс істеу принципінде және осы сынақтың талаптарына толық сәйкестікте жатыр. Әрбір сынақтың белгілі бір архитектуралық ерекшеліктері сынақ нәтижелерінде қалай көрінетінін түсіну үшін ресми сипаттаманы қарастырайық:

CPU ханшайымы

Қарапайым бүтін санды тексеру. Нәтиже, ең алдымен, бүтін операциялар блогының өнімділігіне байланысты, бірақ сонымен бірге Тармақ болжау блогының тиімділігіне өте сезімтал, өйткені оның кодында көптеген шартты тармақтар бар.

Процессордың сағаттық жиіліктері бірдей болған кезде артықшылық қысқа құбыр желісі және болжау қателері аз модельге беріледі. Атап айтқанда, HyperThreading өшірілген кезде Northwood ядросындағы Pentium 4 процессоры Prescott ядросы бар үлгіге қарағанда жақсы нәтижелерге қол жеткізеді, өйткені бірінші жағдайда 31 сатылы құбырға қарағанда қысқарақ 20 сатылы құбыр пайдаланылады. .

Сонымен қатар, HyperThreading қосу қуат балансын өзгертіп, Прескотттың жеңіске жетуіне мүмкіндік береді. Бұған қоса, жетілдірілген филиалды болжау бірлігін пайдаланудың арқасында AMD K8 отбасылық процессорларының өнімділігі K7 отбасылық үлгілерінен жоғары болуы керек.

CPU Queen сынағы SSSE3 нұсқасына дейін MMX және SSE ағындық кеңейтімдерін пайдаланады. Бір мегабайттан аз орын алады жедел жады. HyperThreading, көп процессорлы (SMP) жүйелерін және көп ядролы процессорларды қолдайды.

Бұл сынақты таңдау, ең алдымен, нәтижеге жадтың ішкі жүйесінің және барлық деңгейдегі кэштер көлемінің әсерін толығымен жою мүмкіндігімен байланысты болды. Яғни, салалық болжау блогы қолдайтын ALU жұмысының нәтижесін алыңыз. ALU пакетінің басқа сынақтары аз болса да, кэштердің жиілігі мен өлшемдерінің, сондай-ақ процессор шинасы мен жад шинінің өткізу қабілетінің әсерін әлі де сезінеді. Ал біздің жағдайда әртүрлі ұрпақтың ондаған процессорлары салыстырылғанда, бұл ішкі жүйелердің өнімділігіндегі айырмашылық бірнеше реттік деңгейге жетуі мүмкін. Мысалы, бір кесте мыналарды қамтиды: жад шинасы ені 64 бит болатын SDR-133 жады пайдаланатын Pentium III процессоры және 192 бит жад шинасы бар және DDR3-1333 жадымен жұмыс істейтін Core i7.

Бірақ бұл жағдайда HT қолдауы жігерлендірмейді, өйткені тізімдегі көптеген процессорлар көптеген нақты қолданбалар сияқты оны қолдамайды. Дегенмен, біз HT қолдауы бар және жоқ екі процессорды тікелей салыстыру кезінде бұл фактіні есте сақтаймыз.

ФПУ СинДжулия

Жоғары дәлдікпен (80 бит) өзгермелі нүктелерді есептеу үшін сынақ. Тест модификацияланған Юлия фракталының бір кадрын есептеуге негізделген. Бұл сынақтың коды ассемблер тілінде жазылған, сондықтан Intel және AMD процессорлары үшін тамаша оңтайландырылған. Әсіресе тригонометриялық және экспоненциалды x87 нұсқауларын пайдалана алатын ядролар.
SinJulia FPU сынағы 1 мегабайттан аз жедел жадты алады. HyperThreading, көп процессорлы (SMP) жүйелерін және көп ядролы процессорларды қолдайды.

Көріп отырғаныңыздай, SinJulia FPU сынағы, CPU Queen сияқты, жад ішкі жүйесінің өнімділігіне, сондай-ақ процессор кэштерінің жиілігі мен өлшеміне толығымен тәуелсіз. Сонымен қатар, SinJulia нәтижесі ежелгі K6-III және қазіргі Phenom II салыстыру кезінде объективті болады, өйткені сынақта MMX және SSE сияқты ағындық кеңейтімдер пайдаланылмайды. Ал, есептеулердің жоғары дәлдігі бізге сәйкес қорытынды жасауға мүмкіндік береді заманауи міндеттерпроцессорға тағайындалады.

Сынақтарды таңдау жасалды, бірақ мен ескі және жаңа процессорларды салыстыру нәтижелерінің сәйкестігіне қарсылық білдіретін дауыстарды естимін. Дәлелдердің бірі - әртүрлі ядролар саны мен әртүрлі жиіліктегі процессорларды салыстыру мәселесі. Сонымен, әсіресе салыстырудың объективтілігі үшін нәтижелерге сүйене отырып, біз әрбір сынақ субъектісі үшін қарапайым формуламен есептелген белгілі бір өнімділік коэффициентін алдық:

сынақ нәтижесі/ядролар саны/жиілік

Әрбір процессор үшін осы мәндерді бөлу арқылы біз сағаттық циклге бір ядроның нәтижесін алдық. Сынақтардың сипаттамасын ескере отырып, бірнеше түзетулер енгізу қажет. Біріншіден: HyperThreading қолдауымен процессор әрқашан жақсы нәтижелерге қол жеткізеді. Екінші: SSE қолдамайтын процессорлар ALU тестінде, яғни CPU Queen, төмен нәтиже көрсетеді. Бақытымызға орай, тізімде мұндай процессорлар көп емес, бұл тек AMD K6-III;

Іс жүзінде тексерілген әрбір процессордың өз аналық платасы бар екенін есте ұстаған жөн. Және әрбір платада, сәйкесінше, процессордың анықтамалық жиілігін асыра бағалауға да, төмен бағалауға да қабілетті өзінің сағаттық генераторы бар. Бұл фактінің салдары әртүрлі аналық платалардағы бір процессор үшін сәл өзгеше нәтижелер болып табылады. Біз бұл мәселені жоя алмайтынымызды ескере отырып, нәтижелерде өте үлкен қате қалдыру туралы шешім қабылданды, бұл ақырында өзін ақтап, процессорларды топтарға біріктіруге мүмкіндік берді.

Және бұл ақпарат белгілі бір архитектураның, ал кейбір жағдайларда ядроның тиімділігін барабар түсіну үшін қажет болды. Біраз алға қарап, мен мұны айтамын бұл әдісЕсептеу нәтижелердің жоғары сызықтылығы мен тәуелділігін көрсету арқылы өзін ақтады.

Енді осының бәрін қалай сынағанымыз туралы сөйлесейік. Егер сіз бұрыннан қараған болсаңыз жиынтық кесте, содан кейін оның құрамында әртүрлі ұрпақтың 61 процессоры бар екенін байқаған боларсыз. Әрине, олардың барлығы біздің зертханамызда сынақтан өткен жоқ; Нәтижелердің едәуір бөлігі AIDA 64 2.50 бағдарламасының дерекқорынан алынды, бұл салыстырудағы жалғыз сынақ пакеті болды. Әрине, біз ұсынылған нәтижелерге көзсіз сенген жоқпыз. Біз бірнеше ұқсас процессорлар үшін өз сынақтарымызды жүргізу арқылы олардың деректер базасының нәтижелерін екі рет тексердік. Анықтамалық жиіліктегі қатені және сәйкесінше мұндай жиіліктердегі айырмашылықты ескере отырып, нәтижелер толықтай дерлік ұқсастықты көрсетті. Сондықтан біз, сөзсіз, бағдарлама дерекқорындағы нәтижелерді өз нәтижелерімізбен бір кестеге біріктірдік.

Бұл жерде мынаны да атап өткен жөн әртүрлі нұсқалар AIDA, нәтижелерді есептеу бірдей болмауы мүмкін, сондықтан оларды салыстыруға болмайды. Біздің жағдайда барлық нәтижелер тек 2.50 нұсқасында алынды.

Сынақ нәтижелерін зерттеуге көшудің уақыты келді, ол өте қызықты болды. Біздің негізгі кестені қараудың уақыты келді, онда сіз осы сынақта маңызды процессор сипаттамаларын таба аласыз, және ең бастысы, сағатына негізгі өнімділік туралы бұрыннан көрсетілген деректермен екі сынақтың нәтижелері.

FPU және ALU тиімділігі әр түрлі болуы мүмкін екенін ескере отырып, бір процессордың бүтін деректерде тамаша өнімділікке ие екенін, бірақ өзгермелі нүкте деректерінде айтарлықтай нашар жұмыс істейтінін білуге ​​таң қалмауыңыз керек. Дегенмен, бұл керісінше болады. Әңгімені бастамас бұрын, менің сипаттамадағы реттілік уақыт кестесіне сәйкес болатынын атап өткім келеді, ал кестеде нәтижелер ALU тестінің абсолютті нәтижесі бойынша реттелген.

Бірінші және ең көне процессорлар бұл тізім Sharptooth ядросында AMD K6-III және Katmai ядросында Pentium III үлгілері болады. Бұл процессорлардың осы күндері өте қысқа құбыры бар - Intel үшін тек 12 кезең және AMD үшін кемінде 6 кезең. Осының арқасында соңғысы іс жүзінде тармақты болжау блогын қажет етпейді, өйткені қате жолды таңдаумен байланысты қателер Pentium процессорындағыдай нәтижеге айтарлықтай әсер етпейді. Шын мәнінде, бұл процессорда мұндай болмады, бірақ Intel процессорында болды және қазіргі стандарттар бойынша оның тиімділігі төмен болғанымен, талдау механизмдері қазіргі процессорлардағыдай. Нәтижесінде, қысқа құбырға байланысты AMD K6-III ALU сынауында жоғары нәтижеге ие болды. Оның нәтижесі 2,03 бірлік/цикл болса, бәсекелесінің нәтижесі 1,93. Бұл осы буынның AMD процессорларында SSE ағындық кеңейтімдерін қолдау болмағанына қарамастан! Сонымен қатар, FPU тестінде Pentium III негізінен салалық болжау бірлігінің арқасында, K6 архитектурасының өкілі үшін 0,128-ге қарсы 0,164 бірлік/цикл нәтижесімен алда.


Pentium III тамаша тиімділігімен ерекшеленді. Бұл параметрде тек Athlon ғана әртүрлі табыстармен бәсекелесе алды

Кейінірек пайда болған Pentium III процессорларының өте табысты Coppermine және Tualatin ядролары Katmai архитектурасын өзгеріссіз қалдырды, сондықтан екі процессордың нәтижелері: Celeron 700 және Pentium III 1333 біз көргенге ұқсас. Бірақ AMD, бұл процессорлар шығарылған кезде, K6 архитектурасынан бас тартты, өйткені оның өте қысқа құбырының арқасында ол 550 мегагерцтен жоғары жиіліктерге жетуге мүмкіндік бермеді. Нәтижесінде жаңа K7 архитектурасы ұзағырақ 10 сатылы құбырды және айтарлықтай өнімділікті жақсартуға әкелетін көптеген қосымша мүмкіндіктер мен өзгерістерді алды. Негізгі жаңалық және осы материалдың аясындағы ең маңыздысы салалық болжау блогының пайда болуы болды. Дегенмен, Athlon атауын алған жаңа өнімдер ALU қондырғылары мен Pentium III процессорларының өнімділігінен аса алмады. Бірақ FPU тиімділігі айтарлықтай өсті: бұл параметрде AMD K7 Athlon K6-дан айтарлықтай асып түсті және 0,163 бірлік/цикл нәтижесін көрсетіп, бәсекелестерін қуып жетті. Бірақ ұзағырақ құбыр ALU қондырғысының тиімділігін айтарлықтай төмендетті - циклге 1,58 бірлікке дейін, яғни K6-ға қатысты 25 пайызға дерлік. Дегенмен, бұл ақталды, өйткені сол кездегі қосымшалардың көпшілігінде FPU маңыздырақ болды және ақырында қол жеткізілген жоғары жиілік осы шығындарды жабудан көп болды.

AMD Athlon-тың Thunderbird өзегіне ауысуы бір сағаттағы қуат пен тиімділік тепе-теңдігін өзгертпеді, өйткені бұл ядроның архитектурасы бірдей. Бірақ, олардан кейін көп ұзамай нарықта мүлдем жаңа NetBurst архитектурасына салынған алғашқы Pentium 4 процессорлары пайда болды. Мүмкін, маркетинг және сату тұрғысынан бұл процессорлар сөзсіз жетістік болды, бірақ инженерлік және тиімділік тұрғысынан тарихта бұдан жаман архитектура болған жоқ.


Willamette ядросы бар Pentium 4. Сәтсіз, бірақ таңқаларлық икемді Netburst архитектурасына негізделген алғашқы процессорлардың бірі.

Оның себебі мынада: тұтынушылар қалаған үлкен мегагерцке жету үшін Intel инженерлері жоғары жиіліктерге қол жеткізу үшін тривиальды емес қадамға барды - олар құбырды 20 кезеңге дейін ұзартты; Әрине, мегагерц үшін жарыста олар бірден көшбасшы болды, бірақ сағаттағы өнімділік айтарлықтай төмендеді. ALU тестінде Willamette және Northwood ядроларындағы Pentium 4 процессорларының орташа нәтижесі 1,02, ал FPU тестінде - 0,108. Pentium III нәтижелерімен салыстырыңыз - айырмашылық өте үлкен! Алдыңғы буын процессорларынан жоғары жұмыс істеу үшін Pentium 4-ке айтарлықтай жоғары жиілік қажет болды. Яғни, шын мәнінде, 1400 мегагерц жиілікте жұмыс істейтін Pentium III отбасының ең жоғары процессоры бар ALU қондырғыларының бірдей тиімділігін алу үшін Pentium 4 ядросы 2536 мегагерц жиілікте жұмыс істеуі керек! Ал FPU тестінде бірдей нәтижеге жету үшін сізге 2111 мегагерц қажет, бұл сәл аз, бірақ мүлде аз емес. Яғни, нәтижелерді орташа алғанда, Pentium III 1400 және Pentium 4 2.4 процессорлары тиімділік бойынша шамамен бірдей болады.

Сонымен қатар, AMD жиілікте Intel-ді қуып кетпеді және K7 архитектурасын дерлік өзгеріссіз сақтай отырып, процессорлары бұдан былай жиілікпен емес, «плюс» белгісі бар рейтингтермен белгіленетін Athlon XP процессорларының желісін шығарды. , бұл Pentium 4 процессорларына қатысты тиімділігін көрсетті Яғни, AMD маркетологтарының пікірінше, Athlon XP 1800+ процессоры 1800 мегагерцте жұмыс істейтін Pentium 4-пен бәсекелесуі керек.

Тиімділігін ескере отырып, бұл тәсіл қаншалықты адекватты екенін тексерейік Атлон өзегі XP ALU жүйесінде 1,58 бірлік/цикл, ал FPU жүйесінде 0,163 бірлік/цикл. 1800+ моделінің нақты жиілігі 1533 мегагерцке тең болса, нәтиже Queen CPU-да 2422 бірлік және SinJulia FPU-да 250 бірлік. Бұл ретте жиілігі 1,8 гигагерц болатын Pentium 4 нәтижесі сәйкесінше 1908 және 195 бірлік болады. Рейтинг тіпті төмен бағаланған сияқты. Егер кэштер, автобустар және басқалар сияқты басқа процессор сипаттамаларын ескерсек, нақты қолданбалардағы өнімділік сәл өзгеше болуы мүмкін екенін ұмытпауымыз керек.

Бір қызығы, ащы тәжірибе Intel инженерлеріне жақсы ештеңе үйретпеді және жиілікті арттыру мүмкін еместігіне тап болған олар қайтадан құбырдың ұзындығын ұлғайтуға барады. Сонымен қатар, бірнеше кезеңмен емес, бірақ айтарлықтай - егер Нортвуд ядросында 20 кезең болса, онда Прескоттта олардың 31-і болды және бұл жай ғана ұзын емес, өте ұзын конвейер. Иә, әрине, рахмет бұл өзгеріс, жаңа ядролардың максималды тактілік жиілігінің шегі жоғары болды, бірақ жылуды тарату да жоғары болды.


Прескотт ядросы жоғары мегагерцке ұмтылу кезінде Netburst архитектурасының одан әрі нашарлауы болды. Ең тиімсіз Intel ядросытарих бойы.

Дегенмен, бәрі бірдей бағалай алмайтын ең маңызды өзгеріс оның алдындағымен салыстырғанда тиімділіктің айтарлықтай төмендеуі болды және HyperThreading технологиясының пайда болуы белгілі бір мағынада жағдайды сақтап қалды, бірақ оны пайдаланбайтын процессорлар жай ғана қорқынышты көрсетті. тиімділік деңгейі. Кестеден Pentium D 820 және 925 процессорларын, сондай-ақ Celeron D 326-ны табыңыз және сіз менің не туралы айтып тұрғанымды түсінесіз. CPU Queen тестінде көрсетілген циклдің нәтижесі қарапайым 0,75 бірлік болды және FPU SinJulia жаңартылған NetBurst архитектурасының тиімділігін небәрі 0,081 бірлікке бағалады. Willamette/Northwood ядроларына қатысты өнімділіктің төмендеуі ALU-да шамамен 30% және FPU-да 40% дейін болды.

Prescott-256 және Smithfield AMD K8 процессорларымен салыстыру мүлдем мағынасыз. Жаңа архитектура K7-ге қарағанда екі сатылы ұзын құбырды ғана алды, бірақ сонымен бірге айтарлықтай жақсартылған, көп. тиімді блоксалалық болжамдар. Нәтижесінде жаңа архитектураға негізделген ядролар ALU және FPU тиімділігін біршама жоғары көрсетеді. Орташа CPU Queen сынақ ұпайы 1,74 бірлікке дейін өсті, ал SinJulia FPU алдыңғы қатардағы деңгейде қалды. Көріп отырғаныңыздай, бұл бекер емес Athlon процессорлары 64 және Sempron бір кездері геймерлер тарапынан жоғары бағаланған – олардың тиімділігі өте жоғары, Прескотт және Смитфилд ядролары бар әйгілі Pentium 4-тен екі есе жоғары, бұл қолданбалардың көпшілігінде олар үшін ең жоғары жиілік те көмектеспеді. есе немесе үлкен кэш өлшемі екінші деңгей.


AMD компаниясының өте сәтті шешімі - Athlon 64. Pentium 4-пен салыстырғанда, бұл процессорлар қуатты аз тұтынуымен және тамаша тиімділігімен ерекшеленді.

Дегенмен, осы кезеңде HyperThreading технологиясы Prescott ядросында пайда болғанын есте ұстаған жөн. Әрине, бұл жақсы өмірдің арқасында пайда болған жоқ және ұзын конвейердің кемшіліктерін бүркемелеудің сәтсіз әрекеті болды. Дәл осы технологияның арқасында, ол кезде әлі жетілмеген болса да, инженерлер конвейердің ұзартылуын тегістей алды. Мысалы, Prescott ядросына негізделген және HT-ті қолдайтын Pentium 4 2800E процессоры 20 сатылы құбыры бар ядроларға ұқсас тиімділікті көрсетті, бірақ HT жоқ. Дегенмен, Willamette/Northwood ядроларына арналған HyperThreading қолдауының тиімділігін арттыруға қол жеткізу мүмкін болмады, бұл сирек Pentium 4 3,46 ГГц Extreme Edition процессорының нәтижелерімен дәлелденді, ол Gallatin ядросына негізделген (Northwood аналогы, бірақ 2 МБ L3 кэшімен) және осы технологияны қолдайды.

Біраз уақыттан кейін, NetBurst дәуірінің соңында Intel инженерлері HyperThreading-ті айтарлықтай жақсарта алды және өзгермелі нүктелерді есептеу блогының тиімділігін жақсы арттыруға қол жеткізді. Желідегі ең жылдам, бір ядролы Pentium 4 3,73 ГГц Extreme Edition және екі ядролы Pentium 955 Extreme Edition нұсқаларына назар аударыңыз. Олардың FPU тиімділігі қазірдің өзінде 0,138 бірлік, бірақ ALU өнімділігі бірдей деңгейде. Дегенмен, осының арқасында, оның негізгі бәсекелестерінен - ​​AMD Athlon 64 X2-ден асып түсу мүмкін болмады, соңғысы төменгі тактілік жиілікте жұмыс істейді және HT-ті қолдамайды.

Кестеге қараңыз - NetBurst архитектуралық процессорларының ешқайсысы сол кездегі ең жақсы AMD Athlon 64 6400+ емес, Athlon 64 X2 5200+-мен бәсекелесе алмайды. Дегенмен, Intel «үлкен гигагерцке» ұмтылудың қате екенін әлдеқашан түсінді, сондықтан ең жаңа архитектураны дайындады, ол одан кем түспейтін болады. маркетинг жоспары Pentium 4-ке қарағанда, бірақ әлдеқайда тиімді.


Athlon 64 X2 бүгінгі күннің соңғы процессоры болуы мүмкін, ол Intel процессорларынан жоғары нәтиже береді. Дегенмен, тиімсіз және ыстық Pentium D-ті жеңу қиын болған жоқ.

Біз, әрине, Core туралы айтып отырмыз. Осы архитектураны дамыта отырып, Intel инженерлері бар болғаны 14 сатысы бар құбырға қайта оралды, яғни соңғы NetBurst өкілдерімен салыстырғанда оны екі еседен астамға қысқартты. Әрине, мұндай жағдайларда 4 гигагерцке жету туралы әңгіме болған жоқ, бірақ жаңа отбасының алғашқы өкілдері төмен жиілікке қарамастан, ең жоғары өнімділікті көрсетті. Осы ұрпақтың екі процессоры - Dothan ядросына негізделген Pentium M 730 және Core Duo Yonah ядросындағы T2500 сағатына нәтиже көрсетті, олар Pentium III-ден де жоғары және бәсекелес AMD K8 тобынан айтарлықтай жоғары болды.

Мобильді шешімдерде сыналған архитектура жұмыс үстелі нарығына Core 2 Duo және Pentium Dual Core процессорлары түрінде сәл өзгертілген түрде келді. Шығару кезінде олар жоғары жиіліктермен мақтана алмады, бірақ сонымен бірге олар көрсетті ең жоғары тиімділікжәне нәтижесінде HyperThreading қолдауының жоқтығына қарамастан өнімділік! Әрине, бұл үшін айтарлықтай жақсартылған салалық болжау блогы да жұмыс істеді. Нәтижелерді қараңыз. CPU Queen тестінде Conroe ядросының және оның туындыларының орташа тиімділігі сағатына екі бірліктен жоғары деңгейге көтеріліп, орташа есеппен 2,13-ке жетті. FPU SinJulia тестінде де нәтиже өте жақсы – 0,175. Бұл көп болмаса да, бірінші буындағы Core архитектуралық процессорларынан көп және Pentium 4 ұзақ және сәтсіз күрескен AMD K8 процессорларынан әлдеқайда жоғары.


NetBurst-ті алмастырған Core 2 архитектурасы Intel жоғары тиімді жылдам және салқын процессорлар жасай алатындығын көрсетті.

Ядролардың ең жоғары тиімділігін сәл кейінірек шығарылған бір ядролы Celeron тағы бір рет дәлелдеді, ол Conroe-L ядросының арқасында қарапайым жиілікте екі есе жиілікте жұмыс істейтін предшественниктердің деңгейінде өнімділікті көрсетті. . Ал бұл, ойланыңыз, бір өзегі бар. Тұтастай алғанда, бұл архитектура өзін ең тиімді етіп көрсетті және AMD-ді бәсекелестерін қуып жетуге тырысуға мәжбүр етті.

Міне, AMD проблемалары осы жерден басталды. Енді олар негізгі тиімділікте артықшылыққа ие болмады және оны толығымен қайта құрудың орнына инженерлер K10 буынын және сәйкесінше Phenom және Athlon деп аталатын процессорларды құру кезінде ядролар мен кэштердің санын көбейте бастады. Бұл шешімдердің жалпы өнімділігі, әрине, өсті, бірақ енгізілген өзгерістер тиімділікке аз әсер етеді. ALU өнімділігі тағы да жетілдірілген салалық болжау блогының арқасында аздап өсті, бірақ FPU тиімділігі толығымен өзгеріссіз қалды - мұндай сипаттамалармен Core 2-мен тек ядролардың көп санының арқасында бәсекелесуге болады немесе жоғары жиілік. Соңғысымен, K10 ұрпақ процессорларында, сіз естеріңізде болса, өте күрделі проблемалар болды.


Phenom - бұл сәтсіз процессор. Оның тиімділігі Core 2-ге жетпеді және жиіліктерде күрделі мәселелер болды.

Нәтижесінде Phenom ешқашан Core 2 Duo және Core 2 Quad процессорларына бәсекелес бола алмады. Алайда, көп ұзамай жиіліктер мәселесі шешілді және жаңа Феномдық процессорлар II және Athlon II K10.5 архитектуралары осыған байланысты Intel шешімдерімен бәсекелесуге дайын болды. Бірақ жаңа буынның тиімділігі сол деңгейде қалды, сондықтан AMD шешімдері бірдей жиіліктегі бәсекелестермен бәсекеге түсе алмады. Сонымен қатар, 45 нанометрлік технологиялық технологияға ауысқанда, Intel қайтадан сәулетке аздап сиқыр жасады және FPU блогының тиімділігін 0,185 бірлік/цикл деңгейіне дейін тағы бір арттыруға қол жеткізді.

Ыңғайлы артықшылыққа қарамастан, Intel шеберханалары мен зертханаларында жаңа мінсіз қару жасалды, ол Core архитектурасын жасап шығарды. Негізгі процессорлар i3, i5 және i7 жалпы атауы Nehalem. Блоктардағы келесі өзгерістер және барлық параметрлерді жақсарту тамаша нәтижелерге әкелді. Core i5-750 өнімділігін қараңыз: ALU тиімділігі Core 2 деңгейінде дерлік қалды, бірақ сонымен бірге қазіргі уақытта бүтін операциялардың ең маңызды блогының өнімділігі айтарлықтай өсті - 0,225 дейін. сағатына бірлік!

Бірақ, архитектуралық жақсартулардан басқа, Intel тағы бір супер қаруды - жетілдірілген HyperThreading технологиясын дайындады. Оны қолдану керемет тиімділікке қол жеткізуге мүмкіндік берді. Бұл технология дұрыс оңтайландырылған кезде үлкен әсер берді және тиімділікті бір жарым есеге жуық арттырады! ALU-да 3,05 және FPU-де 0,36 - бұл тамаша нәтижелер. Дегенмен, бұл технологияның қолдауынсыз да, Nehalem архитектурасына негізделген процессорлар өздерінің предшественниктері мен бәсекелестеріне қарағанда тиімдірек болып шықты.


Нехален негізгі тиімділікке барынша назар аударылған алғашқы Intel архитектурасы болды. Нәтиже тамаша болды. Құмды көпір мен Айви көпірі түріндегі ұрпақтар әлі де әлеует бар екенін көрсетті.

Intel корпорациясының келесі екі ұрпағы - Sandy Bridge және Ivy Bridge ядроларына негізделген процессорлар - жиіліктің жоғарылауына байланысты ғана емес, жоғары өнімділікті көрсетті. Ядролардағы кішігірім өзгерістер бүтін операциялар блогының өнімділігін HyperThreading көмегімен де, онсыз да әр ұрпақта 0,25 бірлік/циклге тұрақты түрде арттыруға мүмкіндік берді. Бірақ FPU тиімділігінде ешқандай өзгеріс жоқ. Дегенмен, жақсартулар болмаса да, бұл көрсеткіш өте жақсы. Трендті ескере отырып, Intel процессорларының келесі ұрпағы пайда болған кезде тиімділіктің тағы да жоғарылауын күтуге болады.

AMD мұндай тиімділікті армандай алады. Дегенмен, олар өз процессорларының жұмысын жақсартуға тырысып, бір орында отырмайды. Атап айтқанда, K10.5 архитектуралық ядроларына негізделген Llano процессорлары соңғы Phenom және Athlon-ға қарағанда ALU тиімділігін біршама жоғары көрсетті. Негізінен жетілдірілген салалық болжау блогының арқасында, FPU тиімділігі бірінші Athlon K7 отбасынан бері барлық алдыңғы AMD процессорлары көрсеткендей деңгейде қалды.


K7 ұрпағында басталған AMD отбасының соңғы өкілі - Liano APU. Өкінішке орай, ол соңғы Intel процессорларымен салыстырғанда тиімділікпен жарқырамайды

Дегенмен, тіпті Llano-ны да ескірген шешім деп санауға болады, өйткені AMD процессорларының жақын болашағы 2010 жылы енгізілген мүлде жаңа Buldozer архитектурасының процессорларымен байланысты болады. AMD процессорлары FX және оның туындылары. Дәл осы процессорлар даусыз болып шықты, бұл ядролардың тиімділігін есептеу кезінде бізді тұйыққа тіреді. Мұның бәрі олардағы ядролық ұйымның принципі тым күрделі болғандықтан. Атап айтқанда, FX-8150 процессорында төрт екі ядролы модуль бар және компания оны сегіз ядролы деп жариялайды. Бұл үшін компанияны жазалау үшін оның тиімділігін сегіз ядроға негізделген есептеу толығымен мүмкін болды, бірақ бұл техникалық тұрғыдан дұрыс емес және нәтиже NetBurst архитектурасына негізделген Intel процессорларының деңгейінде болар еді. Сондықтан тиімділікті бір ядроға емес, модульге есептеу туралы шешім қабылданды, бұл әр модульде бір ғана қалқымалы нүктелік есептеу бірлігі бар екенін ескерсек, бұл әбден негізделген.


Бульдозер сәулетіндегі AMD FX тиімділіктің айтарлықтай жоғарылауын көрсетті, бірақ күрделі архитектура әлі ашылған жоқ. Мүмкін ол оны енді ашпайтын шығар.

ALU-де бәрі күрделірек - төрт модульді процессорда мұндай сегіз блок бар, бірақ олар диспетчердің сипаттамаларына байланысты жеткілікті тиімділікпен параллель жұмыс істей алмайды. Windows тапсырмалары Microsoft корпорациясының 7 және одан бұрынғы ОЖ. Сондықтан модульдер санына қарай ALU тиімділігін есептеу туралы шешім қабылданды. Бұл шешім даулы, мен объективтілікті талап етпеймін бұл нәтиже. Ал нәтижелер, айтпақшы, салыстырмалы түрде жақсы болып шықты. Бұрынғыларға қатысты, әрине. Атап айтқанда, даулы ALU нәтижесінің тиімділігі тұрғысынан Бульдозер архитектурасының процессорлары 2,2 бірлік/цикл нәтижесін көрсетті, бұл K10.5, Llano-дан айтарлықтай жоғары және Core 2-ден біршама жоғары, дегенмен Sandy Bridge-ге дейін, тіпті қолдаусыз Hyper Threading әлі де алыс. FPU тиімділігі (бұл нәтижеге толығымен сенуге болады) сонымен қатар барлық алдыңғы AMD шешімдерінен айтарлықтай асып түсті және дәл ерте және соңғы Core 2 архитектураларының арасында болды.

Осы нәтижелерге сүйене отырып, біз Buldozer архитектурасының процессорлары бәсекелес емес деген қорытындыға келе аламыз Intel процессорларыНехалемнен бастап, бірақ ол Core 2-мен өте тиімді күресе алады, тіпті бірдей жиілікте де асып түседі. Жасылдар үшін ең оң қорытынды емес.

Сізге ыңғайлы болу үшін біз барлық нәтижелерді әртүрлі ядролар үшін орташа тиімділік көрсеткіштері бар кестеде жинақтадық.

Біздің зерттеуіміздің осы нүктесінде эллипс қоюға болады. Жоқ, нүкте емес, өйткені бұл материал абсолютті жаһандық болып көрінбейді және мен материалдың басында айтқанымдай, көптеген өте маңызды процессор блоктарының тиімділігін ескермейді. Дегенмен, қуатты ALU және FPU жоқ жылдам процессорлар жоқ және бұл материал бұл постулатты толығымен растады. Тарих бәрін өз орнына қойды, өткен жылдардағы биіктіктен оңай әрі табиғи түрде мөртаңбалар қоюға және қателерді көрсетуге болады. Бірақ дәл осы қателіктер прогрестің тұрақты серігі болып табылады, олар барлық тұйық тармақтарға қарамастан бізді бақытты цифрлық болашаққа тұрақты түрде жетелейді.

Қатысты материалдар:
  • Бірақ бірінші ақаулар пайда болмай тұрып, компьютердің тұрақтылығын дереу тексеріп, оның қандай да бір аппараттық құралы өліп жатқанын білу жақсы ма?

    «Құралдар» бағдарламасы терезесінде іске қосыңыз және таңдаңыз - « Жүйе тұрақтылығын тексеру".

    Іс жүзінде біз мынаны көреміз:

    Жоғарғы графикте компьютер құрамдастарының температуралары көрсетілген. Құсбелгіні қою немесе алып тастау арқылы графиктегі кез келген компоненттің температурасын көрсетуді қосуға немесе өшіруге болады. Тиісінше, егер сіз жұмыс кезінде қызып кетпейтініңізді білсеңіз, кестені бұзбау үшін оны алып тастаңыз. қажет емес ақпарат. Онда бірінші графиктің үстінде басқа ақпаратты (салқындатқыштың айналу жылдамдығы, кернеу және т.б.) көрсететін қойындылар арасында ауысуға болады. Ең құнды қойындысы соңғысы болып табылады, өйткені онда визуалды кестеде (кез келген параметрдің минималды және максимумы жазылған) тестілеу кезінде жиналған барлық статистика (температура, кернеулер және т.б.) көрсетілген.

    Егер сізде сұрақтар туындаса, мен оларға түсініктемелерде немесе арқылы жауап беруге қуаныштымын.

    өзгермелі нүкте бірлігі (FPU) - нақты сандармен математикалық операциялардың кең ауқымын орындауға арналған процессордың бөлігі.

    Intel x86 отбасылық сопроцессорлары

    x86 отбасылық процессорлары үшін өзгермелі нүкте деп аталатын бөлек чипке бөлінген математикалық сопроцессор. Сопроцессорды компьютер тақтасына орнату үшін бөлек қосқыш қарастырылған.

    Сопроцессор толыққанды процессор емес, өйткені ол бұл үшін қажетті көптеген операцияларды қалай орындау керектігін білмейді (мысалы, ол бағдарламамен жұмыс істеуді және жад мекенжайларын есептеуді білмейді), жай ғана қосымша болып табылады. орталық процессор.

    Орталық процессор мен сопроцессордың өзара әрекеттесу схемаларының бірі, атап айтқанда, x86 сопроцессорларында қолданылады, келесідей жүзеге асырылады:

    Басқа платформалар

    Сияқты, аналық платаларКомпания MC68040 процессорын (сопроцессоры кіріктірілген) әзірлегенге дейін Motorola процессорларында құрастырылған компьютерлерде математикалық сопроцессор болған. Әдетте, FPU ретінде 68881 16 МГц немесе 68882 25 МГц сопроцессоры пайдаланылды. Кез келген дерлік заманауи процессордың кірістірілген сопроцессоры бар.

    Weitek сонымен қатар платформалар мен MIPS үшін математикалық сопроцессорларды шығарды.

    FPU құрылғысы

    Тіркеулер FPUкейбір басқа архитектуралардағыдай массив ретінде емес, регистрлер стегі ретінде ұйымдастырылған. Сонымен, FPU стек калькуляторы, кері поляк нотасының принципі бойынша жұмыс істеу. Бұл әрекеттерді орындау үшін нұсқаулар әрқашан стектегі жоғарғы мәнді пайдаланатынын және басқа сақталған мәндерге қол жеткізу әдетте стек манипуляциясы арқылы қол жеткізілетінін білдіреді. Дегенмен, стектің жоғарғы жағымен жұмыс істегенде, стектің жоғарғы жағына қатысты тікелей адрестеу қолданылатынына қол жеткізу үшін басқа стек элементтерін бір уақытта пайдалануға болады. Операциялар оперативті жадта сақталған мәндерді де пайдалана алады. Әдеттегі әрекеттер тізбегі келесідей. Операция алдында аргументтер LIFO стекіне итеріледі; Операция орындалған кезде аргументтердің қажетті саны стектен жойылады. Операция нәтижесі стекке орналастырылады, онда оны әрі қарай есептеулерде қолдануға болады немесе жадыға жазу үшін стектен алып тастауға болады. FPU регистрлерінің жинақталған ұйымдастырылуы программистер үшін ыңғайлы болғанымен, тиімді кодты құру бойынша компиляторлардың міндетін қиындатады.

    Қолдану ерекшеліктері

    3DNow шыққаннан кейін! AMD, содан кейін SSE, Intel Pentium III процессорларынан бастап, бір дәлдіктегі есептеулер FPU нұсқауларынсыз және өнімділіктің жоғарылауымен мүмкін болды. SSE2 кеңейтімі және кейінгі нұсқаулар жиыны кеңейтімдері де жылдам қос дәлдіктегі есептеулерді қамтамасыз етті (IEEE-754 стандартын қараңыз). Осыған байланысты, в заманауи компьютерлерклассикалық математикалық сопроцессордың командаларына қажеттілік айтарлықтай төмендеді. Дегенмен, олар бұрынғы қолданбалармен үйлесімділік үшін және BCD түрлендірулерін немесе кеңейтілген дәлдік есептеулерін қажет ететін қолданбалар үшін (қос дәлдік жеткіліксіз болған жағдайда) өндірістегі барлық x86 процессорларында әлі де қолдау көрсетеді. Қазіргі уақытта пәрмендерді пайдалану x87ең көп болып қалады тиімді жолыосындай есептеулерді жүргізу.

    Деректер пішімдері

    FPU ішінде сандар 80 биттік өзгермелі нүкте пішімінде (кеңейтілген дәлдік) сақталады және келесілерді жадтан жазу немесе оқу үшін пайдалануға болады:

    • Үш форматтағы нақты сандар: қысқа (32 бит), ұзын (64 бит) және кеңейтілген (80 бит).
    • Үш форматтағы екілік бүтін сандар: 16, 32 және 64 бит.
    • Бумаланған бүтін ондық (BCD) сандар – санның максималды ұзындығы 18 бума ондық цифр (72 бит).

    FPU сонымен қатар арнайы сандық мәндерді қолдайды:

    • Нормаланбаған нақты сандар абсолютті мәні ең аз нормаланған саннан кіші сандар. Белгілі бір стек регистрінде мұндай мән қалыптасқан кезде, осы регистрге сәйкес келетін TWR регистр тегінде 10 арнайы мән қалыптасады, оның екілік кескініндегі нормадан тыс санның белгісі нөлдік ретті өріс болып табылады.
    • Шексіздік (оң және теріс), нөлдік емес мән нөлге бөлінгенде, сондай-ақ асып кету кезінде пайда болады. Белгілі бір стек регистрінде мұндай мән қалыптасқан кезде, осы регистрге сәйкес келетін TWR регистр тегінде 10 арнайы мән қалыптасады.
    • сан емес (ағылш. сансыз (NaN)). Сандардың екі түрі бар:
      • SNaN (Signaling Non a Number) – сандар емес сигналдар. Сопроцессор бұл санның стек регистрінде пайда болуына жарамсыз операцияны ерекше жағдайды көтеру арқылы әрекет етеді. Сопроцессор сигнал сандарын жасамайды. Бағдарламашылар дұрыс жағдайда ерекше жағдайды көтеру үшін мұндай сандарды әдейі жасайды.
      • QNaN (Quiet Non a Number) – тыныш (тыныш) сандар емес. Сопроцессор нақты белгісіздік саны сияқты белгілі бір ерекшеліктерге жауап ретінде тыныш емес сандарды жасай алады.
    • Нөл (оң және теріс). Нөлді өзгермелі нүкте пішімі тұрғысынан ерекше мән деп санауға болатынына қарамастан, бұл нормадан тыс санның ерекше жағдайы болып табылады.
    • Белгісіздіктер және қолдау көрсетілмейтін пішімдер. Кеңейтілген нақты сандар пішімінде ұсынылуы мүмкін көптеген бит жиындары бар. Олардың мәндерінің көпшілігі үшін жарамсыз операциялық ерекше жағдай жасалады.

    Тіркеулер

    ФПУ-да регистрлердің үш тобы бар:

    • Процессор стегі: R0..R7 регистрлері. Әрбір регистрдің өлшемі: 80 бит.
    • Қызмет регистрлері
      • Процессордың күй регистрі SWR (Status Word Register) – сопроцессордың ағымдағы жағдайы туралы ақпарат. Өлшемі: 16 бит.
      • Сопроцессорды басқару регистрі CWR (Control Word Register) – сопроцессордың жұмыс режимдерін басқару. Өлшемі: 16 бит.
      • Tags Word Register TWR (Tags Word Register) – R0..R7 регистрлерін басқару (мысалы, жазу мүмкіндігін анықтау үшін). Өлшемі: 16 бит.
    • Көрсеткіш регистрлері
      • DPR (Data Point Register) деректер көрсеткіші. Өлшемі: 48 бит.
      • IPR (Instruction Point Register) командалық индексі. Өлшемі: 48 бит.

    Сопроцессордың командалық жүйесі

    Жүйе шамамен 80 команданы қамтиды. Олардың классификациясы:

    • Мәліметтерді тасымалдау командалары
      • Нақты деректер
      • Бүтін деректер
      • Ондық деректер
      • Жүктеу тұрақтылары (0, 1, Pi, log 2 (10), log 2 (e), log(2), ln(2))
      • Айырбастау
      • Шартты жіберу (Pentium II/III)
    • Мәліметтерді салыстыру командалары
      • Нақты деректер
      • Бүтін деректер
      • Талдау
      • Басынан бастап
      • Шартты салыстыру (Pentium II/III)
    • Арифметикалық командалар
      • Нақты деректер: қосу, алу, көбейту, бөлу
      • Бүтін мәліметтер: қосу, алу, көбейту, бөлу
      • Көмекші арифметикалық командалар (квадрат түбір, модуль, таңбаны өзгерту, көрсеткішті және мантиссаны алу)
    • Трансцендентті командалар
      • Тригонометрия: синус, косинус, тангенс, арктангенс
      • Логарифмдерді және дәрежелерді есептеу
    • Басқару командалары
      • Сопроцессорды инициализациялау
      • Қоршаған ортамен жұмыс
      • Стекпен жұмыс
      • Ауысу режимдері

    Жылдам процессор керемет! Дегенмен, процессордың жұмысына әсер ететін факторлар өте көп. Жылдамдықты тек гигагерцпен өлшейтін адамдар бар - неғұрлым көп болса, соғұрлым жақсы. Тәжірибесі жоғары адамдар әдетте процессордың өнімділігін арнайы сынақтар арқылы немесе үлкен көлемдегі есептеулерді (3D графикасы, бейнелерді қысу және т.б.) қажет ететін нақты қолданбаларда ақпаратты өңдеумен қалай күресетіні арқылы бағалайды. Қазіргі заманғы қолданбалар мен ойындардың көпшілігі нақты сандар (жылжымалы нүкте сандары) бойынша үлкен есептеулерді қажет ететінін ескере отырып, процессордың жалпы өнімділігі олардың қаншалықты жылдам өңделуіне байланысты. Осы мақсаттар үшін процессорда Floating-Point Unit (FPU) деп аталатын арнайы модуль - қалқымалы нүктелерді есептеу модулі бар. Сонымен қатар, бұл модульдің өнімділігі процессордың жұмыс жиілігіне ғана емес, сонымен қатар оның дизайн ерекшеліктеріне де байланысты.

    IBM-үйлесімді компьютерлер эволюциясының басында нақты сандар бойынша есептеулер орталық процессордан бөлек құрастырылған математикалық сопроцессормен орындалды. Дегенмен, 486-шы процессорда Intel кірістірілген қалқымалы нүктелерді есептеу модулін қолданды, бұл процессордың жылдамдығын нақты сандармен айтарлықтай арттырды. Кейіннен дербес компьютерлерге арналған процессорлардың басқа өндірушілері кірістірілген FPU-ға ауысты.

    Нақты сандармен жұмыс істегенде, бүтін операциялардағыдай нюанс бар екенін ескеріңіз - пәрменді процессордың бір тактілік циклінде орындау мүмкін емес («Процессорға конвейер не үшін қажет», «КБ» № /2003 мақаласын қараңыз) . Ал егер 486 процессорда бес сатылы құбыр бүтін сандарды өңдеу үшін қолданыла бастаған болса, онда FPU әлі де құбыр түрі емес еді, яғни. келесі қалқымалы нүкте пәрмені әрқашан алдыңғысының аяқталуын күту керек болды. Бұл мультимедиялық қолданбалармен процессордың жұмысын айтарлықтай баяулатты. Ал соңғылары сол кезде өздерінің «сұраныстарында» тез қарқын ала бастады. Сондықтан Intel компаниясының Pentium процессорларынан бастап конвейерді бүтін санмен ғана емес, сонымен қатар нақты операцияларда да қолдана бастағаны әбден заңды. AMD корпорациясы, өз кезегінде, сәл басқа жолды ұстанды - FPU құбырының орнына ол өз өнімдеріне 3DNow технологиясын енгізе бастады, ол сонымен қатар нақты сандармен операцияларда өнімділікті арттыруға бағытталған. Бұл технология оны жүзеге асыруда көптеген қиындықтарға тап болды. Менің ойымша, көптеген адамдар Pentium II-мен бүтін операцияларда бәсекелесуге арналған AMD K6-2 нақты сандарды өңдеуде одан отыз пайызға артта қалғанын есіне алады.

    Бірақ, олар айтқандай, сіз қателіктерден үйренесіз, сондықтан Athlons және одан кейінгі процессорларда AMD құбырлы типті FPU-ға ауысты. Сонымен қатар, жаңа процессорларда AMD тек суперпайдалануды ғана емес, сонымен қатар өзгермелі нүкте модулінде суперскалярлықты қолданды. бір процессор, шамамен айтқанда, үш FPU модулі бола бастады, олардың әрқайсысы өзгермелі нүктелерді есептеуге қатысады, басқаша айтқанда, Athlon/процессорларының шығарылуымен.

    Қарау