Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Vše o procesorech Integrated Electronics.

Moderátoři: Eddward, Baneshee

Odpovědět
spajdr
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 14. bře 2004
Bydliště: Ostrava Poruba
Kontaktovat uživatele:

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od spajdr »

DOC_ZENITH píše:Head - to už jsme si tu říkali asi tak 3x, nebudu to vypisovat znovu. Pokud je u produktu cena jediná dobrá vlastnost, nedělá to z něj dobrej dobrej produkt.

Spajdr podle toho jak tě poslouchám by jsi si měl dát bacha na subtimingy.

Dle toho jak jsi to popisoval že ti to jelo se 4 modulama na 3200 apak zas nejelo to vypadá že si deska vždy usmyslí jiné subtimingy během memory trainingu a pak to podle toho je stable nebo neni. Tohle neni dobrá cesta, protože by jsi to třeba stabilizoval ale pak se stane ňáká random událost (třeby vypadne elektrika) deska to zapomene, udělá si re-training a nyní bude stejná konfigurace nestabilní ač se předtim tvářila stabilně, protože položky co jsou "auto" se během trainingu nastavily jinak.

Bejt tebou to hodim na nízkej takt, třeba 2400Mhz a ručne locknu úplně všechny subtimingy, naprosto vše, ať máš jistotu že to tak zůstane a pak jít s hlavními timingy + TRFC + frekvencí vejš a uvidíš kam se dostaneš. To že ti nejdou dobře sloty 1+3 je bohužel normal, značí to že máš daizychain desku kter má délku vodičů optimalizovanou jen pro sloty 2 a 4, s tim nic neuděláš.
Diky za tip.
No ten druhy kit neni stabilni ani za prase nakonec, budu ho vracet.
Jednou to jede, pak zase ne, kazdopadne kdyz uz jsem dal timing natvrdo i na nizsi frekvenci tak oproti 2x8GB konfigu je to ve vsem o kousek pomalejsi i kdyz casovani jsem zachoval stejne.
Podle me to nejede optimalne, mozna je IMC na hovno u te 11400F co mam.
Takze vydrzim s 2x8GB kitem a pak az poresim DDR5 s novym AMD procakem nekdy pristi rok.
Kez bych aspon vedel, ktere training se daji vypnout, protoze jak pise zhor, je tam tech polozek vice nez je zdravo.
zhor
Začátečník
Začátečník
Uživatelský avatar
Registrován: 26. čer 2005
Bydliště: Liberec

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od zhor »

To je prave u pameti pruser ze tech polozek jsou tuny umoznujici nastavit nejen casy a napajeni ale i signalovy hodnoty. Globalne se da vypnout Dimm ODT (On-Die Termination) Training se spoustou dalsich polozek a ktery je myslim na auto vypnuty (mozna by stalo za to ho zkusit). I kdyby se v tom clovek vyznal tak se driv zcvokne nez by vsechno manualne nastavil. Proto nezbyva nez nechat vychozi nastaveni, tedy vetsinou auto.
Nastesti se pameti daj zakladnim casovanim a napajenim vzdycky nejak ustabilizovat, akorat je treba pocitat ze clovek nemusi dosahnout ceho si predstavoval.
Docela by me taky zajimalo proc jsou ty K-radice lepsi, u Gskill si toho zrejme pri testovani vsimli a proto na non-K 11 nezarucujou u svych pameti plnou frekvenci. Intel je ovsem v klidu protoze specifikovanych 2933 pujde vzdycky.
PC1: CPU=i7-11700F+NH-U12A | MB=Asus TUF B560M-Plus | RAM=Corsair LPX 2x16G 3600 | GPU=Asus RTX4070 Dual | SSD=Samsung 970 Evo Plus 1T+SSHD: Seagate FireCuda 2T | PS=Corsair TX750M | Case=FD FocusG Mini | Mon= MAG272-165Hz | OS=W10Pro |
PC2: CPU=i7-6700K+NH-U9B | MB=Asus Z170M-Plus | RAM=Corsair LPX 2x8G 3200 | GPU=EVGA GTX980 SC | SSD=Samsung 850 Evo 250G | OS=Kubuntu |
spajdr
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 14. bře 2004
Bydliště: Ostrava Poruba
Kontaktovat uživatele:

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od spajdr »

Tak dobrodruzstvi s taktovanim skoncilo. U prvniho kitu jedna z pameti zacala nahodne hlasit chyby, takze reklamace.
Dnes u druheho kitu, u ktereho jsem chtel vydrzet jeste aspon rok se jedna odporoucela uplne, s ni se ani PC nerozjelo,
takze druha reklamace. Vzal jsem nejake obycejne za 2200,- a kaslu na taktovani. Pro priste vezmu nejdriv lepsi desku,
nez zacnu trochu vice taktovat pameti.
zhor
Začátečník
Začátečník
Uživatelský avatar
Registrován: 26. čer 2005
Bydliště: Liberec

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od zhor »

Desku od Asusu jedine TUF nebo Strix, ty Prime jsou vic kompromisni i kdyz na konzervativni taktovani taky stacej. V tvym pripade to zrejme bude komplot pameti, radice procesoru a desky vcetne biosu. Je klidne mozny ze jeste vydaj novej bios se kterym to pak pujde. Neni taky na skodu zvolit pameti ktery maj uvedeny v QVL i kdyz ani s nimi to nemusi vzdycky vyjit, protoze ovlivnujicich faktoru je spousta.
PC1: CPU=i7-11700F+NH-U12A | MB=Asus TUF B560M-Plus | RAM=Corsair LPX 2x16G 3600 | GPU=Asus RTX4070 Dual | SSD=Samsung 970 Evo Plus 1T+SSHD: Seagate FireCuda 2T | PS=Corsair TX750M | Case=FD FocusG Mini | Mon= MAG272-165Hz | OS=W10Pro |
PC2: CPU=i7-6700K+NH-U9B | MB=Asus Z170M-Plus | RAM=Corsair LPX 2x8G 3200 | GPU=EVGA GTX980 SC | SSD=Samsung 850 Evo 250G | OS=Kubuntu |
Baneshee
Moderátor
Moderátor
Uživatelský avatar
Registrován: 12. dub 2005
Bydliště: Brno
Kontaktovat uživatele:

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od Baneshee »

Zajímavej test Rocketu se zapnutým/vypnutým AVX512 v x265 encodingu https://www.cnews.cz/test-intel-rocket- ... fektivita/

Výkon to zvedne o 10% a spotřebu o 30%. Ještěže tam to AVX512 dali :roll:
Ryzen 5800X @ 100W | Noctua C12P SE14 | 2x16GB Crucial Ballistix @ 3466MHz | Zotac RTX3070 8GB | Asus Prime X470-Pro | Samsung 250GB NVMe & Crucial MX500 1TB & WD Green 3TB | Samsung SH-S223Q | FD Define R3 Black | Seasonic Focus Plus 650W | Dell U2715H
DOC_ZENITH
Středně pokročilý
Středně pokročilý
Uživatelský avatar
Registrován: 08. kvě 2010
Bydliště: Praha

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od DOC_ZENITH »

Tak ono pokud jde o samotné 512-bit verkoty, tak Intel já má stále half-speed ne? Maj podporu ale moc velkej boost se čekat nedá. Ostatně s AVX512 je to tak obecně od začátku, nikdo to nechce, nikdy se to nevyplácelo (ok pomineme li ňákou u specifickou AI instrukci, bavíme se o samotnejch 512-bit vektorech), ale Intel si to hlava nehlava tlačí.

Něco jako když to Koduri komentoval "but our custommers love AVX512" ale už nedokázal odpovědět na "who?".
mr.qeg
Začátečník
Začátečník
Registrován: 05. srp 2007
Bydliště: Dresden

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od mr.qeg »

OT: Daleko lepší by bylo, kdyby Intelu Keller vymyslel variabilní 2048 vektor, ala ARM SVE. Ještě by jim zbyly tranzistory na vícero ALU :-D
Natural
Středně pokročilý
Středně pokročilý
Registrován: 21. srp 2010
Bydliště: Diváky
Kontaktovat uživatele:

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od Natural »

Baneshee píše:Zajímavej test Rocketu se zapnutým/vypnutým AVX512 v x265 encodingu https://www.cnews.cz/test-intel-rocket- ... fektivita/

Výkon to zvedne o 10% a spotřebu o 30%. Ještěže tam to AVX512 dali :roll:
Je tam krásně vidět, že 11900K a 11700K jsou horší procesory, jak 10900K s deseti jádry. Velmi bídná generace (snad kromě 11400F).
mr.qeg
Začátečník
Začátečník
Registrován: 05. srp 2007
Bydliště: Dresden

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od mr.qeg »

Tak pokud někdo to má jen na hry a je mu ukradená spotřeba, posun vpřed tam je. Holt je to o prioritách.
Jan Olšan
Začátečník
Začátečník
Registrován: 19. lis 2016

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od Jan Olšan »

DOC_ZENITH píše:Tak ono pokud jde o samotné 512-bit verkoty, tak Intel já má stále half-speed ne? Maj podporu ale moc velkej boost se čekat nedá. Ostatně s AVX512 je to tak obecně od začátku, nikdo to nechce, nikdy se to nevyplácelo (ok pomineme li ňákou u specifickou AI instrukci, bavíme se o samotnejch 512-bit vektorech), ale Intel si to hlava nehlava tlačí.

Něco jako když to Koduri komentoval "but our custommers love AVX512" ale už nedokázal odpovědět na "who?".
Half-speed je to pokud vím jenom pro floating point operace (tj. FMA v HPC úlohách). Celočíslený operace zdá se i tyhle half-speed verze dokážou počítat s plným výkonem, takže by x265 a x264 mělo pořád profitovat cca stejně jako z full-speed implementace ve Skylake-X.

Ten nízkej nárůst výkonu je kvůli tomu, že se AVX-512 používá jen pro část výpočtů (v tom textu jsem se to snažil trošku přiblížit), proto se vůbec nedá čekat nárůst výkonu +100%, ale ani +50 %.

AVX-512 zrchluje jenom část funkcí, a to ještě jenom v ručně psaným assembleru, protože autovektorizace tam nefunguje. a x265 pořád cca 50 % času stráví v nevektorovém kódu, takže zrychlit se dá jenom půlka CPU času a tu kdybyste zrychlili 2×, tak se dostanete na 75 % původního CPU času, tj, zrychlení jenom o 33 %...

Ta spotřeba to celý kazí, to je jasné (i když podobně neefektivní poměr mezi výkonem navíc a spotřebou navíc je třeba i když člověk přetaktovává). Snad to bude na 10nm/7nm lepší.
AMD Ryzen 9 5950X @EfficiencyModeEn=Enabled, Gigabyte A520 Aorus Elite, 2*16GB DDR4-3600 SiliconPower XPower, Gigabyte Radeon RX 5500 XT Gaming OC 8GB, SiliconPower P32A80 256GB + Patriot P200 1TB + Samsung HD502J 500GB, Be Quiet! Straight Power 11 400W, SilentiumPC Fera 2 / Noctua NH-D9L
jctrnacty
Začátečník
Začátečník
Registrován: 21. úno 2009

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od jctrnacty »

DOC_ZENITH píše:Tak ono pokud jde o samotné 512-bit verkoty, tak Intel já má stále half-speed ne? Maj podporu ale moc velkej boost se čekat nedá. Ostatně s AVX512 je to tak obecně od začátku, nikdo to nechce, nikdy se to nevyplácelo (ok pomineme li ňákou u specifickou AI instrukci, bavíme se o samotnejch 512-bit vektorech), ale Intel si to hlava nehlava tlačí.

Něco jako když to Koduri komentoval "but our custommers love AVX512" ale už nedokázal odpovědět na "who?".
POkud si dobre vzpominam, tak Linus Torvalds si pral at zhyne AVX krutou smrti.

https://www.zdnet.com/article/linus-tor ... ful-death/
_________________
Ryzen 5800X3D, Dark rock 4, Msi Prestige creation X570, Asrock RX 6800 XT, 32GB 3600MHz CL16, Fractal Design Define C, Seasonic focus gold+ 650W, Samsung EVO 970 2TB, X52 Pro, WMR HP Reverb G1, 32" BenQ EW3280U 4K
Jan Olšan
Začátečník
Začátečník
Registrován: 19. lis 2016

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od Jan Olšan »

V tomhle se ale myslím Linus plete.

On jako obecně význam SIMD podceňuje, protože nedělá ani do numerických HPC výpočtů, ani do multimédií, kde je SIMD důležitý, ale jenom do operačního systému/jádra. Z pohledu vývojáře jádra logicky instrukce používané na vysokou propustnost výpočtů vypadají zbytečně, ale je to takovej profesně slepej omyl.

IIRC ho taky hodně štve ten problém se snížením frekvencí, ale jako to asi je věc, který je a bude, protože to může udělat nejen AVX-512, to je od počátku cena za používání turbo boostů...
AMD Ryzen 9 5950X @EfficiencyModeEn=Enabled, Gigabyte A520 Aorus Elite, 2*16GB DDR4-3600 SiliconPower XPower, Gigabyte Radeon RX 5500 XT Gaming OC 8GB, SiliconPower P32A80 256GB + Patriot P200 1TB + Samsung HD502J 500GB, Be Quiet! Straight Power 11 400W, SilentiumPC Fera 2 / Noctua NH-D9L
Dolan
Začátečník
Začátečník
Registrován: 03. kvě 2015

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od Dolan »

On nespomína AVX ale špecificky AVX512, a myslím že jeden z dôvodov je, že tam je veľa rozšírení ktoré sú navzájom nekompatibilné a každý procesor má vpodstate svoju vlastnú ISA.... a je v tom bordel no.

Inak ani pri tých numerických a HPC výpočtoch to nieje ideálne. Best case pre to je linpack, čokoľvek zložitejšie (napríklad 2D matice a viac) už z toho až tak neprofituje. Problém je, že to vyžaduje veľa operácií (šírka vektora X FMA x hĺbka pipeline) a ideálnu dostupnosť dát (nedokáže to spracovať len prvú polovicu vektora v prípade, že druhá nieje dostupná) aby to bolo nejak prínosné.

Btw. Intel by už mal pripravovať AMX...

Ale tuto má podľa mňa lepšie riešenie Apple, ktorý má 4 128b porty, pretože to je oveľa flexibilnejšie. Funguje to v kompilátorom generovanom kóde (ekvivalent SSE) (...kde to má až neuveriteľný výkon :D ) a zároveň to dokáže rýchlo spracovať 512b, ak sa náhodou taký typ úlohy objaví (aj keď prakticky to tam ide cez iné akcelerátory). Dokonca aj AMD tam má určitú flexibilitu.
Jan Olšan
Začátečník
Začátečník
Registrován: 19. lis 2016

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od Jan Olšan »

Dolan píše:On nespomína AVX ale špecificky AVX512, a myslím že jeden z dôvodov je, že tam je veľa rozšírení ktoré sú navzájom nekompatibilné a každý procesor má vpodstate svoju vlastnú ISA.... a je v tom bordel no.
To se myslím přeceňuje.
Dolan píše:Inak ani pri tých numerických a HPC výpočtoch to nieje ideálne. Best case pre to je linpack, čokoľvek zložitejšie (napríklad 2D matice a viac) už z toho až tak neprofituje.
To by platilo spíš pro výpočty na GPU...
AMD Ryzen 9 5950X @EfficiencyModeEn=Enabled, Gigabyte A520 Aorus Elite, 2*16GB DDR4-3600 SiliconPower XPower, Gigabyte Radeon RX 5500 XT Gaming OC 8GB, SiliconPower P32A80 256GB + Patriot P200 1TB + Samsung HD502J 500GB, Be Quiet! Straight Power 11 400W, SilentiumPC Fera 2 / Noctua NH-D9L
Dolan
Začátečník
Začátečník
Registrován: 03. kvě 2015

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od Dolan »

No to nieje tak celkom môj názor. Podľa mňa sa trocha predceňujú aj ARM/NEON optimalizácie... no a aj tak sa tomu skoro každý vyhýba...

Do GPU som som veľmi nechcel ísť... pretože som vedel že z nejakého dôvodu máte opačný názor :D Už z dôb Xeonov Phi, ktorým ste z nejakého dôvodu veľmi nadržiaval, a keď sa potom ukázalo ako katastrofálne failli tak ste to hodil na slabosť Atom jadra (nie celkového konceptu).

Pritom tie Xeony mali taký krásny teoretický výkon pri relatívne nízkej spotrebe. A to platí aj pre klasické Xeony. Ešte pred pár rokmi mali teoretický výkon porovnateľný s GPU. Čím to je že prakticky mali výkon mizerný a ľudia račej kupovali predražené P100?

Pretože v x86 musíte robiť všetko ručne a musí to byť hotové v čase kompilácie. Či už ten vektor, alebo multi-core, multi-socket... Všetko musí byť staticky dané pri kompilácii.

A to je problém všetkých úrovní paralelizácie v X86. Že sa to správa ako VLIW procesor...

S vínimkou out of order samozrejme, kde je okno ale príliš malé... Ak by chceli zachovať efektivitu schedulerov, tak by ich museli mať AVX512 procesory úmerne väčšie (pretože opakujem, problém vektorov je že ak jeden element chýba, tak musí čakať celý vektor)...

Jediná cesta ako zvýšiť výkon je čo najviac 128b ALU na samostatných OoO portoch. Toto je bez diskusie.

Inak všimnite si, že najmä výpočtové grafiky teoretický výkon až tak nezvyšujú, a praktický výkon aj tak podstatne rastie. To preto že Nvidia reálne rieši napríklad data-locality problémy. Možno by to bolo na zaujímavý článok, Nvidia totiž smeruje k tomu že sa celý GPU cluster bude správať ako jedno jadro (cache hierarchia, prístupy do pamätí, komunikácia GPU-GPU-CPU...)

Na druhej strane Intel náháňa len teoretický výkon a všetky optimalizácie hodia na sw. developerov... Preto im to nebude fungovať a AVX512 (v dnešnej podobe) bude mať čestné miesto veľa Itania.
mr.qeg
Začátečník
Začátečník
Registrován: 05. srp 2007
Bydliště: Dresden

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od mr.qeg »

Itanium byl VLIW, jen tomu Intel zas říkal marketingově jinak myslím EPIC :-D Osobně si myslím, že Linus na AVX512 plive kvůli kombinaci všech výše zmíněných vlivů, ale nejdůležitější bude ta roztříštěnost. To je opravdu od Intelu WTF.

Co se týká přístupu raději 4/2x128/256bit vektorových ALU, než 1x512. Je to podle mě spíš o době, kdy to nasadit. Až se postupně bude více rozvíjet SW a bude obecně více SW umět využít 512b ALU, tak bude jistě lepší ta. Otázkou je, zda takový stav nastane ve světě obecného SW. 128SSE už teoreticky může být dostatečné a na zbytek stejně bude lepší ten akcelerátor, ať už GPU či nějaké FPGA přímo ušité na míru konkrétnímu algoritmu.
yuri.cs
Mírně pokročilý
Mírně pokročilý
Uživatelský avatar
Registrován: 03. led 2007
Bydliště: hl.m. piva
Kontaktovat uživatele:

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od yuri.cs »

Problem je zrejme i v tom, ze cim vic Intel zrychluje AVX512, tim vic jde o transistory a cas nasypany do veci, kterou realne vyuzije mizive procento aplikaci (krom implicitniho pouziti v memcpy, a podobne).

Tzn. lze uvazovat, ze usetrene transistory a vyzkum by sly investovat na "general purpose" ucely - nafouknout cache, zpresnit BPU, zvetsit OoO struktury, atd. Tim by se zrychlilo o 5% treba 98% aplikaci, namisto 300% zrychleni 2% aplikaci.
It will be amazing in case after 10GHz we will see 20GHz, 30GHz and so on, just like we witnessed the thorny way from 10MHz to 33MHz in the eighties. -xbitlabs.com
mr.qeg
Začátečník
Začátečník
Registrován: 05. srp 2007
Bydliště: Dresden

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od mr.qeg »

Ano to máš pravdu. Možná to v mém postu tak nevyznělo, ale dokud bude umět AVX512 naplno využít více než 1-2% aplikací, tak bude vždy lepší mít 4x128ALU a 1 AVX512 instrukci s nějakou režií prohnat těmito 4 ALU, protože z nich budou profitovat i zbývající aplikace.

Krásná situace je s tím SSE, až do příchodu Core2, to všechny předchozí CPU zpracovávaly na víc průchodů, či pomocí vícero ALU. V roce 2006 už zřejmě majorita používala SSE2 díky vynucení v x86-64 a tak Core2 tímto přineslo brutální zrychlení.
Jan Olšan
Začátečník
Začátečník
Registrován: 19. lis 2016

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od Jan Olšan »

mr.qeg píše:Otázkou je, zda takový stav nastane ve světě obecného SW. 128SSE už teoreticky může být dostatečné a na zbytek stejně bude lepší ten akcelerátor, ať už GPU či nějaké FPGA přímo ušité na míru konkrétnímu algoritmu.
Linus má iirc názor že 128bitů není ještě sice úplně "dost pro každého", ale 256 bitů (AVX2) zase už nepřidá až tak moc, takže zůstat na 128bitech by nebyl úplně blbý nápad, tj. jako ARM s Neon před příchodem SVE.

Jinak ale instrukce SIMD v procesoru nemají stejné využití jako akcelerace na GPU, takže ač se to často říká, tak je chyba říkat si, že nejsou třeba, protože GPU. Některé aplikace GPU zastoupí, jiné ne.
Třeba x265 nebo x264 by se na GPU nedalo udělat. SIMD instrukce v procesoru je přístupná okamžitě s minimální latencí pro jakýkoli program běžící na CPU - nepotřebuje žádný ovladač nebo stack, takže různé výkoné rutiny se dají krásně zapracovat do programů a o tom je všechna ta optimalizace v assembleru. Zatímco když chcete něco offloadnout na GPU, tak se musí vyskočit z toho běžného vykonávání kódu na procesoru, zavolají se nějaké vrstvy OpenCL nebo Cuda, teď to snad kolikrát i jede přes kompilátor v GPU ovladači...
GPU je užitečné když mám velký kus kódu, který potřebuje ten výkon a běží na tom GPU poměrně dlouho, než se ten výsledek bude tahat zpátky do toho mateřského programu na CPU. Když chcete jenom optimalizovat nějaký menší prvek CPU programu, tak se to použít nedá, protože overhead je masivní.
mr.qeg píše:Co se týká přístupu raději 4/2x128/256bit vektorových ALU, než 1x512. Je to podle mě spíš o době, kdy to nasadit. Až se postupně bude více rozvíjet SW a bude obecně více SW umět využít 512b ALU, tak bude jistě lepší ta.
Ono je to o tom, že není výběr mezi 4x128bitů (SSE nebo lépe AVX2 ve 128bitové formě) a 1x512. Jako na jednu stranu je ta první možnost hrozně výhodná, protože zrychlí i všechen legacy kód bez modifikace, což je super. Jenže - když se SIMD operace provádějí rozsekané na víc 128bitových částí, tak pak zabírají místo navíc ve všech frontách, konzumují šířku v různých fázích vykonávání, a pak samozřejmě to znamená, že máte místo jednoho 512bitového portu a jednotku v procesoru čtyři paralelně a na to musí být navržené všechny ty fronty/buffery, schedulery a tak dál. A to je komplexita navíc, která není snadná a má svoje ceny.
V případě, že mám volbu mezi 4x128bitovou pipeline (ALU) a 1x512 tak je určitě lepší nápad to první, už jenom proto, že bych jinak měl mizerný výkon v SSE kódu (jenom jedna operace za cyklus).
Jenže architekti právě nechcou 1x512, oni by chtěli 2x512, 3x512 nebo líp 4x512 (i když 3-4x za cyklus by jádro třeba umělo zpracovat jenom sčítání, logické operace a tak, ne MUL nebo FMA).
No a to pak ta alternativa je 8x128bitová pipeline, 12x128bitová pipeline... a to už je rozhodně příliš velká komplexita a průser na realizování.
Takže v tomhle bodě je určitě lepší místo 8-12x 128 jít aspoň do AVX(2) a rozšířit vektor na 256 bitů, takže budu mít jenom 4-6 SIMD pipeline, což je mnohem snazší (i když 6 už je dost, to asi zatím nikdo nedělá, teda ne když se nepočítají load/store jednotky - výpočetní instrukce umí myslím i Zen 3 i Tiger Lake všechny maximálně 4x za cyklus).

4x256 bitů je podle mě nesporně užitečná věc, to stojí za to do procesoru dát. No ale právě potom když se má SIMD výkon rozšiřovat dál, tak logicky zase přichází ten problém přílišného počtu pipeline, takže 512bitové SIMD vektory jsou logická další cesta. Ice/Tiger/Rocket Lake pokud vím umějí některé ty 512bitocé instrukce s propustností 3x za cyklus a nevím jistě jestli některé ne i 4x, což by se nedalo tak rozumně udělat s AVX2, protože by muselo být 6-8 ALU pipeline, takže zase začíná být problém.

Ty porty/ALU pipeline jsou prostě drahé, takže je lepší zvýšit SIMD výpočetní výkon jedné pipky něž přidávat další.

Ten problém je samozřejmě jestli to consumer software pak může někde upotřebit a/nebo jestli budou mít programátoři vůli to dělat... v serveru/HPC tam je asi celkem jasné, že to nějaké využití má.
AMD Ryzen 9 5950X @EfficiencyModeEn=Enabled, Gigabyte A520 Aorus Elite, 2*16GB DDR4-3600 SiliconPower XPower, Gigabyte Radeon RX 5500 XT Gaming OC 8GB, SiliconPower P32A80 256GB + Patriot P200 1TB + Samsung HD502J 500GB, Be Quiet! Straight Power 11 400W, SilentiumPC Fera 2 / Noctua NH-D9L
mr.qeg
Začátečník
Začátečník
Registrován: 05. srp 2007
Bydliště: Dresden

Re: Intel i9-11900k, i7-11700K, 11600k - recenze, zkušenosti

Příspěvek od mr.qeg »

Anebo AVX512 pro video, což je snad asi jediná oblast, kde to může dnes najít využití, nahradit vícero jádry :wink:
Ice/Tiger/Rocket Lake pokud vím umějí některé ty 512bitocé instrukce s propustností 3x za cyklus a nevím jistě jestli některé ne i 4x
A kterou tu podmožinu AVX512? Celou, nebo zase jen vybranou část. Opět jsme u toho, co Linus asi kritizuje.

Jinak není nutné vytrhávat z kontextu moje příspěvky a pak mi dlouze vysvětlovat, něco, co je mi jasné. Psal jsem tam: "s nějakou režií prohnat těmito 4 ALU".
Odpovědět

Zpět na „Procesory Intel“