Re: Ryzen R7 1700/1700X/1800X - infa, recenze a zkušenosti
Napsal: ned 5. bře 2017, 00:03
Musíš zvednout CL, na mejch pamětech je Ryzen stable až LC17-18 a pak se dostane na těch 2933 (CL 18-17-17-38 2T).CageJ píše:Auto cl15/2T
OK hoši, tak už jsem dotestoval, připravte se na wall-of text.
Defakto vše co jsem očekával se potvrdilo. Jsou to 2 CPU pod jednim IHS a i se tak chovaj a trpěj všemy nedluhy jako numa systémy. Sice je dopad menší než jsem čekal, ale stejně to tam je.
Nejprve k OC. OC je prostě slabé, to už víme, ta deska co jsem měl ASUS PRIME B350-PLUS dovolí max vcore offset +0.2v, což je v praxi 1,3875v, což mi dovolilo testovat na 4Ghz (mam R7 1700 bez X), takže ony bencharky co zde vidíte je Ryzen na 4Ghz. U pamětí jsem měl štěstí. Jsou to tyhle:
https://www.czc.cz/corsair-vengeance-lp ... 58/produkt
A i přes velké dual-rank moduly jsem se dostal na 2933Mhz CL18-17-17-38 2T stable. (děličky Ryzenu jsou 1866,2133,2400,2666,2933,3200).
Co se OC týče bylo děsně simple, šlo jen o frekvenci jádra a jeho voltáž, všechny ostatní voltáže měly alespoň u mě vliv 0, CPU ani RAM, hraní s nima mi ničemu nepomohlo. Při vyšších frekvencích je full-loadu problém také teplota. Jakmile CPu přelezl vevnitř přes 90 vztrácel stabilitu i když jsem snížil stav. Rock stable (i v primu small fft test kterej to nejvíce vyburnuje) jsem se nakonec ustálil na 3850Mhz s +1,875v offset high LLC. 3900 chtělo o něco vyšší voltáž na max +0.2 offset + max llc, a to už ale teplota v prime vyšplhala na 95 a pak byl crash. Throttling nikdy nenastal. Při ručnim OC se rovněž ihned vypnou všechny power control funkce, taktuje se vše společně (ne jádra nezávisle) a nefungujou pak C-states, turbo, nic, CPU má stabilní takt, bez ohledu jestli jsou v biosu enabled nebo disabled.
Obecně ale Ryzen moc netopí. Ano topí cca jak taková 3930K ve full loadu, ale v light loadu a v idlu je i po OC naprosto studennej. Spotřeba rovněž nebyla nijak tragická, kaksáda mé cheap desky to dala v poho. Obecně vše je hodně studenné (kor na AMD) i chipset či jiné komponenty na desce vůbec netopí, je to pravej opak oproti FX.
Chladič jsme použil starej Scythe ninja, když jsem jej pootočil tak rozpětí děr AM4 sedlo na rozpětí jeho děr (nastavitelné mezi LGA775-155x), resp 2 z nich napříč, tak jsem ho tam přišrouboval a bylo (nechtěl jsem použít box kdybych to vracel).
Teď k výkonu, Zen easy shrnu jako slepenec dual-CPU s extra silnou ALU, FPU, slabší AVX a tragickou prostupností/řadičem RAM, a od toho se odvíjí výkon. V aplikacích co nejsou vůbec o ram nebo o komunikace skrze cache je Zen bomba. Cinebench byl stejně skvělej jak v recenzích (už jsem jej postoval včera).
Co se týče video enkódingu tak pokud se nepoužívá AVX je to drtička s vyššim IPC jak Intel, pokud se použije AVX, tak Havliho HWbot X265 benchamrk mi vyšel takto:
1080p - 44,36
x265 - 4k: 10,82
Vše normal mode, žádnej overkill. To ihmo ujde, ano je to o něco méně jak Intely, ale jen o chlup + zas o dost více jak Starší Sandy/Ivy. Je vidět že extra silná FPU Zenu to prostě prorve i když musí AVX256-bit instrukce dělat na 2 průchody.
____________________________________
OK, teď to nejdůležitější kvůli čemu jsem to vlastně testoval. Co ty dva CPU bloky vedle sebe? Co to dělá s hrama? Co HT? Opravdu je to škodná? No, tak se na to podívejme. Soupeřemu našeho Zenu na 4Ghz bude můj main PC, Xeon E5-2679v4 kterej věží na 3,3Ghz všechny jádra, s jeho masivní 50MB monolytickou L3 a k tomu 128GB DDR4 ECC REG pamětí na 2400Mhz CL15. Je to momentálě stále nejrychlejší x86 CPU overall, ale herně ně, 7700K a 5775C OC ho daj. Nenechte se zmás tim taktem 3,3Ghz, díky té cache nažene strašnej herní výkon navíc, kterej odpovídá 6900K na 4-4,5Ghz dle toho jak z toho ten či onen engine dovede profitovat. Jeho výsledky jsou tyto:
Final fantasy heavensward benchmark: (testováno 720p fullscreen, laptop preset high detail), GPU byla GTX980TI oclá na 1414/7900Mhz) = 29458bodů.
Crysis3, physics louka co využije až 12 jader, 720p no AA vše na max. = 122fps
Fallout 4 - Headova známá CPU scéna z boston commons. = 58fps
UT99 botmatch (nechal jsem spawnout 128 botů, z toho 64 do jedný místnosti na hold-position a změřil framerate když se všichni dospawnovali). = 65fps
Tak, a co Zen?
Napřed Crysis3. Zen dal čistě se všim všude stejnej config 83fps.
To je méně jak dala E5-1650V1/3930K ala 6 jádrovej Sandy na 4,2Ghz. Trochu zklamání. Co je horší je, že to i threadovalo hůře. Na Xeonu si to sežralo těch svejch max 12 a ty měly load cca 85%. Na Zenu ale měly thready load jen cca 45%. Proč? Můj závěr je jasnej, byl zde bottleneck v prostupnosti paměti. Jakmile se ta stala bottleneckem, další threadování už ničemu nepomohlo, protože se stejně čekalo než data X dorazí z RAM. Jsou to prostě dva 4 jádrový CPU dělící se o jeden poměrně pomalej a latentní mem controller.
Výkon s HT off byl 76fps ( lehkej pokles je logickej, protože jak už jsem řekl hra v této scéně chce 12 threadů).
Výkon s lock na jen jeden CPU (first 4C 8T) byl 65fps.
Výkon s lock stejnej počet threadů cross oba CPU (middle C4 8T) byl 58fps.
Lock jen na druhej CPU (last 4C8T) byl opět 65fps, takže ehm no... numa je tady.
Teď Fallout 4.
Default nastavení dle win = 47,5fps.
HT ON + lock na jeden CPU = 49fps.
HT OFF + lock na 1 CPU = 50fps.
Te%d Final fantasy benchamark, kde jsem toho natestoval nejvíce protože krásně reaguje na všechna nastavení.
Default nastavení: 21111 bodů.
Default nastavení + HT OFF = 21266 bodů.
Vnuceno cross numa = 20073bodů.
Vnuceno jen 1 CPU jen non HT = 20726 bodů. (hra ale v DX11 na NV využije i lehce nad 4 thready takže...
Vnuceno jen 1 CPU + aktivní HT. = 22816.
Teď test vlivu OC vs OC RAM (nastavení vnucení threadů stále jak v poslednim testu s 22816).
CPU 4Ghz RAM 2133Mhz: 17599 bodů.
CPU 3,2Ghz RAM 2933Mhz: 17946 bodů.
Na taktech RAM teda dost záleží, jejich OC má cca stejnej vliv jak OC jádra.
Teď ještě jeden test, zde omluvte nišší skóre, musel jsem dělat windwoed protože tenhle benchramk odmítal nastavt 720p fullscreen na mém CRT (ač ostatní dovedly) a předchopzí testy byly na LCD, a výkon v okně je obecně o trochu horší.
Zde jsem se zabejval položnou memory interleaving v biosu.
None: 17535
channel: 18885
DIE: 18816
Socket/auto 18860
Rank interleaving má větší efekt čím více ranků na CPU je (tzn dvě dual-rank paměti budou mít vyšší benefit interleavingu než dvě single, jedna signe nemůže interleavovoat), zkoušel jsem i změny chování spoustění cross CPU či single CPU ale tam byl dopad 0. Nakonec jsem nechal ne auto ale DIE, protože to obecně mělo nej skóre v hrách i cinebenchi. Tyto 4 testy nahoře byly s forced cross numa.
S forced CPU1 bez HT = 19669
S HT: 20032
A teď UT99, ryzen v hale plné botů dal 77fps. Ano, pozor, toto je více jak 65 co dal Xeon. Je to celkem logické co se zde děje. Tato hra má kvůli svému stáří velice malé nároky na CPU cache a RAM, tzn Xeon tam ze své giga cache netěží (ani 5775C co jsem měl dříve netěžila), a Ryzen zde neni těžce bottleneckovanej svou + RAM a ukáže se jeho brutální síla v pure x86 a x87.
A teď ještě poslední test. Mít dva CPU v systému nemá jen negativa pro hry plynoucí z numa podstaty. Má to i svá pozitiva, třeba to že dva CPU = komplet nezávislé front-endy, vše, pokud teda jeden dělá komplet nezávislou činnost na druhym, nebudou se navzájem vůbec brzdit což umožnuje lepší multitasking. Zde u Zenu se budou brzdit jen v RAM, takže efektivita tohoto záleží na tom jak jsou ony operace o prostupnosti RAM, každopádně ale, spustil jsem na CPU 1 Final fantasy benchmark (v okně s niššim skórem, nastavení odpovídající poslednímu testu), a na CPU2 jenl 4K x265 enkóding benchark co tento CPU loadoval na 100%. Výsledek:
Locked CPU1 + 2 = 18145 bodův FF. +5,78fps v X265.
Mixed, hra i X265 jely oba cross CPU ale stále měly oba svejch 8 threadů. = 16467 / 5,74. Tzn zde je pěkně vidět že X265 to bylo skoro fuk, ale hra utrpěla tim že musí bežet cross s nejednotnou L3.
A teď poslední just for fun, oba procesy total free, žádnej lock na nic, jen vyoská prio na FF a nízká na x265 jak sy s tim win poperou. Yep.... nepopraly, fail. 4587 / 8,25. Nádhera windows.... fakt nádhera. Process lasso (přes kterej jsem řešil všechny locky, kuddos těm co to udělali, bez tohodle programu bych byl dost ztracenej protože win a jejich správa threadů a priorit prostě fail) je zde dost nutností.
Tzn pokud to mam shrnout tak se potvrdilo to co jsem říkal, prostě jsou to dva CPU co se snažej prezentovat jako jeden. Já už jsem s tim měl zkušenosti z mejch dual-CPU systémů z minulosti tak jsem věděl po čem mam jít a vše se potvrdilo. Nicméně propad je menší jak třeba dual-xeony přes QPI, infinite fabric se snaží co se dá, ale jeden CPU z toho prostě neudělá. Když se s tim člověk naučí žít jak s dual-CPU numa systémem a naučí se přiřazovat hry jen jednomu CPU je to celkem fajn. Je to super na případnej streaming kde se dá OBS locknout na CPU 2 a pak vůbec nezasahuje do CPU 1 kde běží hra, žádnej stutter, nic. BFU systémy to moc dobré nebudou, resp ne ty dual die. 4C single die Ryzeny budou i pro BFU dobré. Asi nejméně doporučim 6C ryzena, jeho 3/3 dělení bude v praxi v hrách zlobit mnohem více protože mít pro hru k dispozici 4C8T nebo 3C6T je sakra rozdíl. Samo sebou můžou se oběvit i extra multithread hry kde benefit MT převází penalizaci nejednotné L3 (jako v Crysis) ty ale zas hodně rychle doběhnou na bottlenck v prostupnosti RAM, tak to Intely roztrhaj. Bethesda se nechala slyšel že bude dělat na Vulcanu a optimalizacích pro Zen a Vegu. Pokud někdo chce optimalizovat herní engine pro ZEN, měl by se hlavně soustředit na to aby byl co nejméně závislej na prostupnosti RAM, to je pro Zen více klíčové jak multithread, protože Zen je v čistym singlu silnej.
Co říci na závěr. Dle mého názoru je Zen velkej comeback AMD. Je to produkt mnoha silných a slabých stránek. Ty slabé by ale do budoucna šly vyladit.
Je to skoro neuvěřitelné, ale AMD udělalo architekturu která je silnější jak ta Intelova. Zen má ALU a FPU rychlejší jak BW, i Skylake. Drtí to i v legacy x86,x87,MMX kódu. SSE je extra silné. Co Zen zabijí, a to hlavně v hrách je to že jsou to 2 CPU s nejednotnou cache, a hlavně největší bolest Zenu, pomalej, neefektivní a latentní řadič RAM. I tak to ale neni fail. Ano na soudobé intely to v hrách nemá, ale neni to FX, dá se na tom ihmo vše solidně zahrát (kor když si člověk pohlídá thready a zamkne hru na 1 CPU). Výkon v nehernim nasazení je pak vesměs skvělej, kor za tu cenu. Rovněž se mi nepotvrdily zvěsti o pomalém HT co by kazilo herní výkon, pár jednotek % tam či tam možná, ale je to neznatelné a rozhodně bych HT nevypínal.
Další pozitivum je přítomnost celé škály virtualizace (IOOMU) i na cheap deskách. Další věc co bych znovu vyzdvihnul je obrovskej posun AMD v energetický efektivitě. Časy přehřejvajících se nenažranejch krámů jsou pryč.
Prostě pokud AMD dovede udělat native 8-core a vylepší řadič RAM, tak se intel může pomalo začít potit. Současnej ZEN na to aby vyklepnul Inteláckou HEDT ještě nemá, ale místy už ano, jen na ve všem. Tak i tak je to ale super-value. Jediný co bych řekl ještě do - je že u toho CPU vidim malej potenciál pro další zlepšování. Ryzen 1 už všechny své karty ukázal, absence fullspeed AVX2, TSX, a bottleneck v RAM nejsou žádnym příslibem do budoucna, to nejlepší už jsem viděli. Potenciální Ryzen 2 s monpolytickou die + cache a fast RAM ale... ten je ve vzduchu.
Obecně můžu koupi Ryzenu doporučit. Orientoval bych se ale hodně na "value" ligu. Myslim si že je špatné rozhodnutí brát předraženou rádoby ač nic moc nepřinášející high-end desku, k tomu nevýhodnej 1800X (nebo i 1700X), atd. Ne. Jděte na to jinak, od lesa. 1700 je skvělej deal. I ten chladič co k tomu dávaj je good, neni to shit, zatim nej box co jsem kdy viděl, tichej, měděný jádro a pasiv jak intelák k LGA1366. Tzn co já doporučuji, je vzít cheap mainstream B350 desku, k tomu R7 1700 a chadit jej boxem (což bude na to OC k cca 3,8Ghz stačit), nejlevnější paměti (můžete použít i ECC, ale ne ECC REG) co najdete protože tahle platforma rychlé neocení, stejně skončíte na 2666-2933 což daj i ty nejlevnější moduly na trhu. A tohle kombo vám dá výpočetní výkon jak 6900K.... někde i vejš, a herní výkon průměrně jak 3930K. Takže tak. Investovat extra peníze do drahý desky, vyššího modelu CPU, chlazení, RAM, je zde chyba.