Operace s pohyblivou řádovou čárkou za sekundu

Jednotky výpočetního výkonu s plovoucí desetinnou čárkou s předponami podle SI .
kFLOPS Kilo FLOPS = 10 3 FLOPS
MFLOPS Mega FLOPS = 10 6 FLOPS
GFLOPS Giga FLOPS = 10 9 FLOPS
TFLOPS Tera FLOPS = 10 12 FLOPS
PFLOPS Peta FLOPS = 10 15 FLOPS
EFLOPS Exa FLOPS = 10 18 FLOPS
ZFLOPS Zetta FLOPS = 10 21 FLOPS
YFLOPS Yotta FLOPS = 10 24 FLOPS

Pohyblivé řádové čárce za sekundu (short propadne , angličtina pro obvody ) je měřítkem výkonnosti z počítačů nebo procesorů a je počet operací s plovoucí desetinnou čárkou ( doplnění nebo násobení ), které mohou být provedeny jimi za sekundu.

Často se nazývá FLOP plovoucí čárkou provoz (anglicky FL oating bodu op inno ) uvedené, které se příležitostně také objevuje variantě Flop / s, ovšem obě varianty jsou ekvivalentní.

popis

Počet operací s plovoucí desetinnou čárkou není nutně přímo úměrný k rychlosti hodinový na procesoru , neboť - v závislosti na implementaci - plovoucí čárkou operace vyžadují různý počet hodinových cyklů . Vektorové procesory provádějí až několik tisíc operací v každém cyklu. Grafické karty, které fungují jako vektorové procesory, dosáhnou v roce 2020 výpočetního výkonu s jedinou přesností (SP, 32Bit Float) 30 TeraFLOPS, což je také motivací pro outsourcing operací s pohyblivou řádovou čárkou na grafický procesor ( GPGPU ). Výpočetní výkon superpočítačů závisí nejen na počtu a výkonu použitých procesorů, ale také na typu a rychlosti síťového propojení výpočetních uzlů. Velkou roli může také hrát použitý software.

Ve většině případů, stejně jako u jednotky IPS , je uveden odhad nejlepšího případu nebo dokonce hodnota, která je pouze teoreticky možná.

výpočet

Teoretický špičkový výkon jednotlivého výpočetního uzlu lze vypočítat vynásobením následujících hodnot:

  • Taktovací frekvence
  • Počet soketů CPU
  • Jádra CPU na soket
  • min(Příkazy, které lze spustit za cyklus ,Počet aritmetických /jednotek Latence příkazu)
  • Datová slova na výpočetní registr
  • numerické operace na příkaz

Pro

  • 2,5 GHz
  • 2 základny
  • 24 jader
  • 2 spuštěné příkazy za cyklus
  • 8 datových slov na výpočetní registr (256bitový registr pro jeden nebo 512bitový registr pro dvojitou přesnost)
  • 2 numerické operace na příkaz (FMA)

Získá se 7,68 TFLOPS.

Výpočetní výkon počítačových systémů

FLOPS počítače jsou určeny definovanými programovými balíky ( benchmarky , jako je LINPACK nebo Livermore benchmark ). Seznam žebříčku TOP500 zobrazuje 500 nejrychlejších počítačových systémů, měřeno podle jejich FLOPS s benchmarkem LINPACK. Existují počítačové systémy se srovnatelnými službami, které se hodnocení neúčastní, takže tento seznam není úplný. První volně programovatelný počítač, který mohl být použit v praxi, elektromechanický Zuse Z3 z roku 1941, zvládl necelé 2 přírůstky za sekundu a tedy 2 FLOPS. Jiné operace však někdy trvaly mnohem déle.

Koprocesor Intel 8087 z roku 1980 s hlavním procesorem 8088 zvládl 50 kFLOPS. Na začátku 21. století dosáhl počítač s procesorem Pentium 4 s hodinovou frekvencí tří gigahertzů podle IBM zhruba šesti GigaFLOPS. Konvenční grafická karta bude v roce 2020 poskytovat až 30 TeraFLOPS.

Poměr výpočetního výkonu k poptávce po elektrické energii se zlepšuje, přičemž se zvyšuje celková dodávka energie. Například BlueGene / L od IBM , který byl v seznamu TOP500 11/2005, vyžadoval na svůj výkon přibližně 280 Tera FLOPS pouhých 70  prostoru a 1770  kW elektrického výkonu, což je ve srovnání se Earth Simulator tři roky starší (35,86 TeraFLOPS). s 3 000 m² a 6 000 kW představuje významné zlepšení. Elektrický výkon je hlavním důvodem, proč starší systémy již nejsou provozovány jako superpočítače a přibližně každých pět let je instalována novější generace počítačů.

Další příklad: Nejrychlejší počítač v Německu v červenci 2005, 57 milionů EUR NEC s 576 hlavními procesory ve vysoce výkonném výpočetním centru Stuttgart (HLRS), dosáhl až 12,7 TeraFLOPS a byl optimistický, protože byl 5 000krát rychlejší než „normální“ počítač s názvem . Provozovatel stanovil provozní náklady (bez pořízení) na 1,3 milionu eur ročně a 1,5 milionu eur na osobní náklady. Kvůli vysokým pořizovacím nákladům byl tak výkonný systém pronajat pro celý systém hodinovou sazbou přibližně 4 000 eur (členové univerzity ve Stuttgartu však zaplatili výrazně nižší cenu).

V březnu 2006 byl v Jülichu uveden do provozu nejnovější „nejrychlejší“ počítač v Německu, JUBL (Jülich Blue Gene / L ). S 45,6 TeraFLOPS to byl šestý nejrychlejší počítač na světě, který nabídl výpočetní výkon 15 000 „normálních“ současných počítačů. Hodnocení vývoje požadavků na výpočetní čas generálním ředitelem výzkumného centra Jülich (březen 2006) je zajímavé pro další vývoj: „Poptávka po výpočetním čase se v příštích pěti letech zvýší faktorem 1000.“

Přibližně 700 000 aktivních počítačů v Berkeley Open Infrastructure for Network Computing dosáhlo v prosinci 2015 průměrného výkonu kolem 12 Peta FLOPS

Korelátor z na Atacama Large milimetr / submilimetrové Array (ALMA) provádí 17 petaflops v prosinci 2012, přičemž výpočetní výkon korelátoru Widar k rozšířenému Very Large Array (EVLA) je specifikována jako 40 petaflops.

Různí operátoři superpočítačů se v současné době snaží proniknout do výkonové řady Exaflops. Akumulace dalších a dalších procesorů dosahuje hranic toho, co je fyzicky proveditelné. S počtem procesorových jader roste nejen výpočetní výkon, ale také spotřeba energie a odpadní teplo, požadavky na výměnu dat, datové sítě i ukládání a archivaci dat. Novější systémy jsou stále více navrženy tak, aby generovaly další výhody z generovaného odpadního tepla. Takže takto z. B. Budovy nebo skleníky jsou vytápěny. Někdy se uvažuje, zda by superpočítače neměly být vybaveny vlastními elektrárnami.

Příklady hodnot GFLOPS na některých CPU
LINPACK 1kx1k (DP) Maximální výkon
(v GFLOPS)
Průměrný
výkon (v GFLOPS)
Účinnost
(v%)
Buňka , 1 SPU, 3,2 GHz 1,83 1,45 79,23
Buňka, 8 SPU, 3,2 GHz 14,63 9,46 64,66
Pentium 4 , 3,2 GHz 6.4 3.1 48,44
Pentium 4 + SSE3, 3,6 GHz 14.4 7.2 50,00
Core i7 , 3,2 GHz, 4 jádra 51.2 33,0 ( povoleno HT ) 64,45
Core i7 , 3,47 GHz, 6 jader 83,2
Core i7 2600k, Sandy Bridge , 3,4 GHz, 4 jádra 102,5 92,3 90,05
Itanium , 1,6 GHz 6.4 5,95 92,97
Nvidia Tesla GP100 , 1,48 GHz 10600
Nvidia Quadro P6000 19553 12901
Xeon Skylake SP 6148 1536
AMD Ryzen 1800X, 8K / 16T, zatím neoptimalizované 221
Intel Core i7-7700K , 4K / 8T 241
Intel i7-5960X, 8K / 16T 375
Intel Core i7 5820k, 6K / 12T, 3,3 GHz 273,1 265

Viz také

Individuální důkazy

  1. Operace s pohyblivou řádovou čárkou za sekundu (flopy). In: Slovníček hesel na adrese heise online ; Ke dni 8. listopadu 2010
  2. Testováno Nvidia GeForce RTX 3080: Zapněte zesilovače! In: heise.de , přístup 18. září 2020
  3. Coprocessor.info - x87 informací, které potřebujete vědět! 30. září 2011, přístup 14. srpna 2019 .
  4. High-Performance Computing Center University of Stuttgart / Systems
  5. Ve Švábsku se výpočty provádějí extrémně rychle. In: Stern.de , 22. července 2005, přístup 17. ledna 2014.
  6. Plán poplatků za využívání výpočetních systémů v oblasti vysoce výkonných počítačových centrum Stuttgart (HLR) ( memento na originálu z 23. října 2013 v Internet Archive ) Info: archiv odkaz se automaticky vloží a dosud nebylo přijato kontrolovány. Zkontrolujte původní a archivační odkaz podle pokynů a poté toto oznámení odeberte. (PDF; 105 kB)  @1@ 2Šablona: Webachiv / IABot / www.hlrs.de
  7. ^ Berkeley Open Infrastructure for Network Computing. In: boinc.berkeley.edu
  8. Výkonný superpočítač dělá z ALMA dalekohled
  9. Nejvyšší superpočítač na světě porovnává astronomická data. In: Heise online
  10. National Radio Astronomy Observatory: Cross -Correlators & New Correlators - Implementation & selection of architecture str. 27 (PDF; 9,4 MB)
  11. National Radio Astronomy Observatory: The Expanded Very Large Array Project - The 'WIDAR' Correlator p. 10 (PDF; 13,2 MB)
  12. IBM: Cell Broadband Engine Architecture a její první implementace
  13. tecchannel.de
  14. a b c Anon: Výsledky Ryzen 1800X linpack. In: https://i.imgur.com/RDvvhN0.png . reddit.com, 27. února 2017, přístup 27. prosince 2017 .