Množství dat

Množství dat je měřítkem množství dat . Základní jednotkou objemu dat je bit .

Data se používají k ukládání a předávat informace , přičemž je třeba poznamenat, že informace o obsahu do zprávy je to stejné jako množství dat, a to i v případě, že slovo informace jsou často používán v tomto kontextu, kdy se odkazuje na data. Na rozdíl od množství dat nelze informační obsah okamžitě odečíst a existují různé přístupy k jeho určení. Množství dat uložených v souboru se nazývá velikost souboru . V případě datových nosičů se množství dat používá k určení volného a maximálního úložného objemu dat ( úložná kapacita ).

Množství dat, které je požadováno k uložení dané informace, závisí na jedné straně na složitosti informací a na druhé straně na metodě kódování . U velkého množství dat existují metody komprese, které snižují objem dat, ale ukládají stejné informace. Vhodný způsob kódování se používá pro zvýšení informační obsah jednotlivých znaků nebo snížit entropii na zprávy (viz také entropické kódování ).

Data nemusí být nutně explicitně kódována jako bity nebo uložena v počítači. Data jsou všude v přírodě i v našem každodenním světě. Největší množství dat je v našem mozku , v našich knihovnách , knihách , filmech , obrázcích a počítačích , v genomu a molekulárních strukturách živé přírody, v zákonech neživé a živé přírody , ve struktuře celého vesmíru a v maximálních možných informacích historii celého vesmíru.

Základní jednotka

Nejmenší datovou jednotkou, kterou lze reprezentovat, je bit . Bit je zkratka pro binární číslici , dt. Binární číslice . Datová paměť s jedním bitem skladovací kapacity má pouze jedno místo v paměti pomocí dvou možností: například „obsazeno nebo vyprázdnit“, „zapnout nebo vypnout“, „zářezem nebo žádným zářezem“. Množství dat obsažených v jednom rozhodnutí ano / ne je tedy přesně 1 bit. Pro čtyři možné hodnoty (například červená, žlutá, zelená, modrá) jsou vyžadovány dva bity, které lze kombinovat čtyřmi různými způsoby (00, 01, 10, 11).

Formálně to znamená, že požadované množství dat (počet bitů) je zaokrouhleným výsledkem logaritmu na základ 2 počtu možných hodnot.

nebo naopak: Počet možných hodnot je 2 k síle počtu bitů:

Tak například

  • 0 bitů Z = 1, pokud D = 0, protože 2 0 = 1
  • 1 bit Z = 2, pokud D = 1, protože 2 1 = 2
  • 2 bit Z = 4, pokud D = 2, protože 2 2 = 4
  • 7 bitů Z = 128, pokud D = 7, protože 2 7 = 128

Součet bitů od 0 do 7 (odpovídá 1 bajtu) 2 8 -1 může proto pokrývat rozsah desetinných hodnot od 0 do 255.

  • 8 bitů Z = 256, pokud D = 8, protože 2 8 = 256

...

  • 63 bitů Z = 9223372036854775808, pokud D = 63, od 2 63 = 9223372036854775808

Pro D = 1 KiB je počet možných hodnot Z velmi velký: 2 1024 ≈ 1,8 · 10 308 .

Více jednotek

Kromě bitu je nejběžnější jednotkou pro množství dat bajt (nebo oktet ), který se skládá z 8 bitů. Existují historické důvody pro toto: Mnoho zařízení byly navrženy tak, aby mohly zpracovat 8 bitů současně (dnes se jedná obvykle 32 nebo 64 bitů - viz datové slovo pro to ), takže 8 bitů se díval jako na čísla od procesorové jednotky . Dále jsou písmena z většiny znakových sad , zejména z ISO 8859 , reprezentována jako bajt.

V historii počítačů existovaly systémy, které kombinovaly pouze 5 bitů do jednoho bajtu, a existovaly také systémy, které kombinovaly 13 bitů do jednoho bajtu.

Pro označení většího množství dat jsou jednotkové znaky bit pro bit a B pro byte opatřeny běžnými předponami pro jednotky měření , tj. Kilo (kbit / kB), mega (Mbit / MB), giga (Gbit / GB), tera (Tbit / TB) a tak dále. Existují speciální binární předpony pro datové sady založené na mocninách dvou, jako jsou ty, které se vyskytují v polovodičových pamětí .

Příklady množství dat

bit

  • 1 bit - (2 1 = 2 možné stavy), např. B. 0 nebo 1 nebo nepravdivé nebo pravdivé
  • 5 bit - (2 5 = 32 možných stavů), např. B. může povolit mapování velkých písmen latinské abecedy
  • 7 bitů - (2 7 = 128 možných stavů), např. B. znak ze znakové sady ASCII

Nibble nebo půl bajtu

  • 1 okusovat - (2 4 = 16 možných stavů), např. B. 015
  • 2 okusovat - (2 8 = 256 možných stavů), tj. 1 oktet

Bajt nebo oktet (8 bitů)

  • 1 oktet - (2 8 = 256 možných stavů), např. B. charakter od ANSI kódování (rozšířená Latinská abeceda )
  • 2 oktety - (2 16 = 65 536 možných stavů)
  • 4 oktety - (2 32 = asi 4,3 miliardy možných stavů), např. B. charakter v UTF-32 formátu

Relevantní předpony

Řeckým a italským předponám měrných jednotek obvykle předcházejí bity a bajty . V následujícím textu jsou předpony SI (k, M, T, G, ...) použity v jejich desetinném významu. V IT praxi se předpony SI většinou používají jako binární předpony (1 kB = 1024 bajtů, ...) pro objemy dat. Přijetí binárních předpon IEC (Ki, Mi, Gi, ...) poskytovaných pro tento účel je v IT průmyslu nízké, dokonce i při běžných názvech je obvykle implikována konverze 1024 bajtů.

Kilos a Kibi

Kilobyte (kB) (10 3  bajty = 1000 bajtů),
Kibibyte (KiB) (2 10  bajtů = 1024 bajtů), ale KB se obvykle píše, aby se odlišil od kB, protože je častější.

Mega a Mebi

Megabyte (MB) (10 6  bytes = 1,000,000 bytes),
Mebibytes (MiB) (2 20  bytes = 1,048,576 bytes)

  • cca 4 MB: Bible jako text (kódováno ANSI / ASCII)
  • přibližně 703,1 MiB nebo přibližně 737,25 MB: běžný 700 MB datový disk CD-ROM

Giga a Gibi

Gigabyte (GB) (10 9  bajtů = 1 000 000 000 bajtů),
gibibajty (GiB) (2 30 bajtů = 1 073 741 824 bajtů)

  • přibližně 4,38 GiB, takže přibližně 4,7 GB: DVD ± R
  • přibližně 5 GB: komprimovaný film v kvalitě DVD (s kompresí MPEG-2 )

Tera a Tebi

Terabajt (TB) (10 12  bajtů = 1 000 GB),
tebibyte (TiB) (2 40  bajtů = 1 099 511 627 776 bajtů)

  • Databáze, která zaznamenává 10 miliard lidí s datovými sadami po 1 kB, vyžaduje 10 TB úložiště.

Peta a Pebi

Petabyte (PB) (10 15  bajtů = 1 000 000 GB),
Pebibyte (PiB) (2 50  bajtů = 1 125 899 906 842 624 bajtů)

  • Skladovací kapacity největších světových datových center se na konci roku 2002 pohybovaly mezi 1 PB a 10 PB
  • V roce 1986 činila efektivní kapacita světa pro výměnu (optimálně komprimovaných) informací prostřednictvím (obousměrných) telekomunikačních sítí 281 petabajtů .

Exa a Exbi

Exabyte (EB) (10 18  bajtů),
Exbibyte ( EiB ) (2 60  bajtů = 1152 921 504 606 846 976 bajtů)

  • Celkový počet všech tištěných prací se odhaduje na 0,2 EB
  • Efektivní světová kapacita pro výměnu informací prostřednictvím (obousměrných) telekomunikačních sítí byla v roce 2007 65 (optimálně komprimovaných) exabajtů a celosvětová technologická kapacita pro ukládání informací byla v roce 2007 odhadem 295 (optimálně komprimovaných) exabajtů.

Zetta a Zebi

Zettabyte (ZB) (10 21  bajtů),
Zebibyte ( ZiB ) (2 70  bajtů = 1180 591 620 717 411 303 424 bajtů)

Yotta a Yobi

Yottabyte (YB) (10 24  bytů),
Yobibyte (YiB) (2 80  bytů = 1 208 925 819 614 629 174 706 176 bytů)

  • 1 YB jsou o tolik bytů, kolik je atomů v 1,67 gramů vodíku , což odpovídá 0,83 mol H 2 .

Viz také

bobtnat

  1. http://history.nasa.gov/alsj/a11/a11.1201-pa.html
  2. a b c „Světová technologická kapacita pro ukládání, komunikaci a výpočet informací“ , Martin Hilbert a Priscila López (2011), Science , 332 (6025), 60-65; Volný přístup k článku je k dispozici na této stránce: martinhilbert.net/WorldInfoCapacity.html
  3. Video animace o světové technologické kapacitě pro ukládání, komunikaci a výpočet informací od roku 1986 do roku 2010

webové odkazy