[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Keine Bearbeitungszusammenfassung
K Änderungen von 2003:E5:C737:9482:2896:BE24:4E1A:B0B9 (Diskussion) auf die letzte Version von Ulm zurückgesetzt
Markierung: Zurücksetzung
(19 dazwischenliegende Versionen von 15 Benutzern werden nicht angezeigt)
Zeile 10:
Was genau ein Byte bezeichnet, wird je nach Anwendungsgebiet etwas unterschiedlich definiert. Der [[Begriff]] kann stehen für:
 
* eine [[Maßeinheit]] für eine [[Datenmenge]] von 8&nbsp;Bit mit dem [[Einheitenzeichen]]&nbsp;„B“,<ref>IEC&nbsp;60027-2, Ed. 3.0, (2005–2008): Letter symbols to be used in electrical technology – Part 2: Telecommunications and electronics.</ref> wobei es nicht auf die Ordnung der einzelnen Bits ankommt.<br />Das EinheitszeichenEinheitenzeichen sollte nicht mit dem zur Einheit&nbsp;[[Bel (Einheit)|Bel]] gehörenden EinheitszeichenEinheitenzeichen&nbsp;„B“ verwechselt werden.
* eine geordnete Zusammenstellung ([[Tupel#Verwendung|n-Tupel]]) von 8&nbsp;Bit, deren formale [[Internationale Organisation für Normung|ISO]]-konforme Bezeichnung [[Oktett (Informatik)|Oktett]] ist (1&nbsp;Byte = 8&nbsp;Bit). <!-- Bitte Diskussionsseite beachten -->Ein Oktett wird manchmal in zwei Hälften ([[Nibble]]s) zu je 4&nbsp;Bit zerlegt, wobei jedes Nibble durch eine [[Hexadezimalsystem|hexadezimale Ziffer]] darstellbar ist. Ein Oktett kann also durch zwei Hexadezimalziffern dargestellt werden.
* die kleinste, meist per [[Adressbus]] adressierbare, Datenmenge eines bestimmten technischen Systems. Die Anzahl an Bits pro Zeichen ist dabei fast immer eine natürliche Zahl. Beispiele:
Zeile 47:
Das ''[[Bit]]'' ist ein [[Kofferwort]] aus den [[Englische Sprache|englischen]] Wörtern ''{{lang|en|'''b'''inary}}'' und ''{{lang|en|dig'''it'''}}'',<ref>[https://www.duden.de/rechtschreibung/Bit_Einheit_in_der_EDV Bit (Einheit in der EDV)] – ''Duden'', Bibliographisches Institut, 2016</ref> heißt also „zweiwertige [[Ziffer]]“&nbsp;– Null oder Eins. Dessen Bestandteile lassen sich auf die [[latein]]ischen Wörter ''digitus'' (Finger), den bzw. die man seit der Antike zum Zählen verwendet (vgl. [[Plautus]]: ''{{lang|la|computare digitis}}''), und lateinisch (genauer neulateinisch) ''binarius'' (zweifach), vergleiche lateinisch ''bis'' (zweimal), zurückführen.
 
{{Belege fehlen|Die Behauptung, der Begriff "Byte" leite sich (auch) von "bite" ab wird vom Beleg nicht gestützt.}}
Das ''Byte'' ist zudem ein [[Kunstwort]] und wurde wohl aus dem englischen ''{{lang|en|bit}}''<ref name="Duden" /> (deutsch „[das] Bisschen“ oder „Häppchen“) und ''{{lang|en|bite}}'' (zu deutsch: „[der] Bissen“ oder „Happen“) [[Wortbildung|gebildet]].<ref>{{Webarchiv |url=https://www.duden.de/woerterbuch/englisch-deutsch/bite |text=bite |wayback=20161119060016 |archiv-bot=2019-08-28 17:00:07 InternetArchiveBot}} (englisch-deutsch) – ''Duden'', Langenscheidt, 2015</ref> Verwendet wurde es, um eine Speichermenge oder Datenmenge zu kennzeichnen, die ausreicht, um ein Zeichen darzustellen. Der Begriff wurde im Juni 1956 von [[Werner Buchholz (Ingenieur)|Werner Buchholz]] in einer frühen Designphase des [[IBM 7030 Stretch|IBM-7030-Stretch]]-Computers geprägt,<ref name="Buchholz_1956_1" /><ref name="Buchholz_1956_2" /><ref name="Bemer_2000" /> wobei die Schreibweise von ''bite'' zu ''byte'' geändert wurde, um zu vermeiden, dass es sich versehentlich zu ''bit'' ändere.<ref name="Fenwick" /> Im Original beschrieb es eine wählbare Breite von ein bis sechs Bits (damit konnten <math>2^6 = 64</math> Zustände, z.&nbsp;B. Zeichen, dargestellt werden) und stellte die kleinste direkt adressierbare Speichereinheit eines entsprechenden Computers dar.<ref name="Blaauw_1959" /><ref name="Buchholz_1962" /><ref name="Buchholz_1977" /> Im August 1956 wurde die Definition auf ein bis acht Bits aufgeweitet (damit konnten dann <math>2^8 = 256</math> Zeichen dargestellt werden).<ref name="Buchholz_1977" /><ref name="Buchholz_1956_3" /><ref name="Bemer_1959" /> So konnte man die Buchstaben und gängige Sonderzeichen zum Beispiel in Quelltexten von Programmen oder anderen Texten speichern (also verschiedene Zeichen).
 
Das ''Byte'' ist zudem ein [[Kunstwort]] und wurde wohlvermutlich aus dem englischen ''{{lang|en|bit}}''<ref name="Duden" /> (deutsch „[das] Bisschen“ oder „Häppchen“) und ''{{lang|en|bite}}'' (zu deutsch: „[der] Bissen“ oder „Happen“) [[Wortbildung|gebildet]].<ref>{{Webarchiv |url=https://www.duden.de/woerterbuch/englisch-deutsch/bite |text=bite |wayback=20161119060016 |archiv-bot=2019-08-28 17:00:07 InternetArchiveBot}} (englisch-deutsch) – ''Duden'', Langenscheidt, 2015</ref> Verwendet wurde es, um eine Speichermenge oder Datenmenge zu kennzeichnen, die ausreicht, um ein Zeichen darzustellen. Der Begriff wurde im Juni 1956 von [[Werner Buchholz (Ingenieur)|Werner Buchholz]] in einer frühen Designphase des [[IBM 7030 Stretch|IBM-7030-Stretch]]-Computers geprägt,<ref name="Buchholz_1956_1" /><ref name="Buchholz_1956_2" /><ref name="Bemer_2000" /> wobei die Schreibweise von ''bite'' zu ''byte'' geändert wurde, um zu vermeiden, dass es sich versehentlich zu ''bit'' ändere.<ref name="Fenwick" /> Im Original beschrieb es eine wählbare Breite von ein bis sechs Bits (damit konnten <math>2^6 = 64</math> Zustände, z.&nbsp;B. Zeichen, dargestellt werden) und stellte die kleinste direkt adressierbare Speichereinheit eines entsprechenden Computers dar.<ref name="Blaauw_1959" /><ref name="Buchholz_1962" /><ref name="Buchholz_1977" /> Im August 1956 wurde die Definition auf ein bis acht Bits aufgeweitet (damit konnten dann <math>2^8 = 256</math> Zeichen dargestellt werden).<ref name="Buchholz_1977" /><ref name="Buchholz_1956_3" /><ref name="Bemer_1959" /> So konnte man die Buchstaben und gängige Sonderzeichen zum Beispiel in Quelltexten von Programmen oder anderen Texten speichern (also verschiedene Zeichen).
 
In den 1960er Jahren wurde der sich in seiner Verwendung schnell ausbreitende [[American Standard Code for Information Interchange|ASCII]] definiert, welcher sieben Bits zur Kodierung eines Zeichens verwendet (das sind <math>2^7 = 128</math> Zeichen). Später wurden durch Nutzung des meist sowieso vorhandenen achten (höchstwertigen) Bits erweiterte, auf dem ASCII basierende Zeichensätze entwickelt, die auch die häufigsten internationalen [[Diakritika]] abbilden können, wie zum Beispiel die [[Codepage 437]]. In diesen erweiterten Zeichensätzen entspricht jedes Zeichen exakt einem Byte mit acht Bit, wobei die ersten 128 Zeichen exakt dem ASCII entsprechen.
Zeile 64 ⟶ 66:
Das Byte ist die Standardeinheit, um [[Speicherkapazität]]en oder Datenmengen zu bezeichnen. Dazu gehören Dateigrößen, die Kapazität von permanenten Speichermedien ([[Festplattenlaufwerk]]e, [[Compact Disk|CDs]], [[DVD]]s, [[Blu-ray Disc]]s, [[Diskette]]n, [[USB-Massenspeicher]]geräte usw.) und die Kapazität von vielen flüchtigen Speichern (zum Beispiel [[Halbleiterspeicher#Wahlfreier Zugriff|Arbeitsspeicher]]). Übertragungsraten (zum Beispiel die maximale Geschwindigkeit eines Internet-Anschlusses) gibt man dagegen üblicherweise auf der Basis von Bits an.
 
== {{Anker|Präfixe|Einheiten für große Mengen Byte|Einheiten für große Mengen Bytes}} Bedeutungen von Dezimal- und Binärpräfixen für große Anzahlen von BytesByte ==
=== SI-Präfixe ===
{{Hauptartikel|Vorsätze für Maßeinheiten}}
Zeile 86 ⟶ 88:
 
=== Vergleich ===
Vor allem weil die Speicher-Kapazitäten der Hersteller meist nur mit SI-Präfix angegeben sind, kann es gerade in Verbindung mit Microsoft-Systemen zu Verwirrung kommen. Denn Microsoft rechnet für Datengrößen immer mit Zweierpotenzen, gibt diese dann aber mit Hilfe der SI-Präfixe an. So wird also ein 128-GB-Speichermedium als 119,2&nbsp;GB angezeigt, obwohl es laut IEC 119,2&nbsp;GiB lauten müsste. Hinzu kommt die Verwirrung der Benutzer, dass laut Microsoft 120&nbsp;GB (eigentlich 120&nbsp;GiB) nicht auf ein mit 128&nbsp;GB beworbenes Speichermedium passen und ein Fehler ausgegeben wird. Vergleich:
 
Von einem Präfix zum Nächsten wird das Verhältnis von Binär zu Dezimal um einen Faktor <math> 2^{10}/10^{3} </math> größer. So beträgt siees zwischen KiB und kB 2,4 %, zwischen TiB und TB hingegen bereits 10≈10,0 % (Prozentangaben auf 1 Nachkommastelle [[Rundung|gerundet]]). Eine anschauliche Übersicht über die möglichen Einheitenvorsätze und deren Bedeutungen bietet die ''[[#Vergleichstabelle|Vergleichstabelle]]''.
* 128&nbsp;GB = 128.000.000.000&nbsp;Byte sind weniger(!) als
* 120&nbsp;GiB = 128.849.018.880&nbsp;Byte = 120 × 1024<sup>3</sup>&nbsp;Byte
 
{{Byte}}
Für größere Dezimal- und Binärpräfixe wird die Unterscheidung größer, da die nominelle Differenz größer wird.
Von einem Präfix zum Nächsten wird das Verhältnis von Binär zu Dezimal um einen Faktor <math> 2^{10}/10^{3} </math> größer. So beträgt sie zwischen KiB und kB 2,4 %, zwischen TiB und TB hingegen bereits 10,0 % (Prozentangaben auf 1 Nachkommastelle [[Rundung|gerundet]]). Eine anschauliche Übersicht über die möglichen Einheitenvorsätze und deren Bedeutungen bietet die ''[[#Vergleichstabelle|Vergleichstabelle]]''.
 
==== Kapazitätsangaben bei Speichermedien ====
 
Massenspeichermedien, wie [[Festplattenlaufwerk|Festplatten]], [[DVD]]-RohlingenRohlinge und [[USB-Massenspeicher#USB-Speicherstick|USB-Speicher-SticksSpeichersticks]], mit vorgeschaltervorgeschalteter komplexer Firmware lassen sich in praktisch beliebig fein abgestufter Größe herstellen. Dort hat sich die Herstellung in glatten, gut vermarktbaren Größen durchgesetzt. Die Hersteller verwenden Dezimalpräfixe. RAM-Hauptspeicher und Cache-Speicher von CPUs, auf die in ihrer ziemlich ursprünglichen Form zugegriffen wird, werden als glatte Werte mit Binärpräfixen angegeben, SI-Präfixe wären hier unpraktisch. Für Kunden ist dessen genaue Größe meist irrelevant, da sie mit diesen Größen selten direkt in Kontakt kommen.
 
Wenn die Binärpräfixe nicht normgerecht geschrieben werden, ergeben sich Probleme: Ein mit „4,7&nbsp;GB“ gekennzeichneter DVD-Rohling wird von mancher Software, zum Beispiel derdem [[Windows-Explorer]], mit dem Wert von „4,38&nbsp;GB“ angezeigt – im Sinne des IEC richtig wäre hier „4,38&nbsp;GiB“ –, obwohl rund 4,7&nbsp;Gigabyte (4.700.000.000&nbsp;Byte) gemeint sind. Ebenso wird eine mit „1&nbsp;TB“ spezifizierte Festplatte mit der scheinbar deutlich kleineren Kapazität von etwa „931&nbsp;GB“ oder „0,9&nbsp;TB“ erkannt (auch hier sollte eigentlich „931&nbsp;GiB“, beziehungsweise „0,9&nbsp;TiB“ angezeigt werden), obwohl jeweils rund 1,0&nbsp;Terabyte (1.000.000.000.000&nbsp;Byte) gemeint sind. Andererseits enthält ein mit „700&nbsp;MB“ gekennzeichneter CD-Rohling tatsächlich 700&nbsp;MiB (734.003.200&nbsp;Byte), also etwa 734&nbsp;MB (und sollte somit streng genommen mit „700&nbsp;MiB“ ausgezeichnet werden).
 
Vor allem weil die Speicher-Kapazitäten der Hersteller meist nur mit SI-Präfix angegeben sind, kann es gerade in Verbindung mit Microsoft-Systemen zu Verwirrung kommen. Denn Microsoft rechnet für Datengrößen immer mit Zweierpotenzen, gibt diese dann aber mit Hilfe der SI-Präfixe an. So wird also ein 128-GB-Speichermedium als 119,2&nbsp;GB angezeigt, obwohl es laut IEC 119,2&nbsp;GiB lauten müsste. Hinzu kommt die Verwirrung der Benutzer, dass laut Microsoft 120&nbsp;GB (eigentlich 120&nbsp;GiB) nicht auf ein mit 128&nbsp;GB beworbenes Speichermedium passen und ein Fehler ausgegeben wird. Vergleich:
Apples [[macOS]] benutzt ab Version [[Mac OS X Snow Leopard]] (10.6)<ref name="Mac" /> einheitlich Dezimalpräfixe nur in dezimaler Bedeutung. [[KDE Software Compilation 4|KDE]] folgt dem IEC-Standard und lässt dem Anwender die Wahl zwischen binärer und dezimaler Angabe. Für Linux-Distributionen mit anderen Desktopumgebungen, wie zum Beispiel [[Ubuntu]] ab Version 11.04,<ref name="Ubuntu" /> gibt es klare Richtlinien, wie Anwendungen Datenmengen angeben sollen; hier findet man beide Angaben, wobei die Binärpräfixe überwiegen.
 
* 128&nbsp;GB = 128.000.000.000&nbsp;Byte sind weniger(!) als
* 120&nbsp;GiB = 128.849.018.880&nbsp;Byte = 120 × 1024<sup>3</sup>&nbsp;Byte
 
Apples [[macOS]] benutzt ab Version [[Mac OS X Snow Leopard]] (10.6)<ref name="Mac" /> einheitlich Dezimalpräfixe nur in dezimaler Bedeutung. [[KDE Software Compilation 4|KDE]] folgt dem IEC-Standard und lässt dem Anwender die Wahl zwischen binärer und dezimaler Angabe. Für Linux-Distributionen mit anderen Desktopumgebungen, wie zum Beispiel [[Ubuntu (Betriebssystem)|Ubuntu]] ab Version 11.04,<ref name="Ubuntu" /> gibt es klare Richtlinien, wie Anwendungen Datenmengen angeben sollen; hier findet man beide Angaben, wobei die Binärpräfixe überwiegen.
 
[[Unix-Shell]]s nutzen normalerweise [[Datenblock|Datenblöcke]] als Einheit. Optional wird auch eine lesbarere Darstellungsform, ''{{lang|en|human readable}}'' bezeichnet, angeboten, normalerweise die binäre Einheit, wobei jedoch abweichend von der IEC-Vorgabe nur die [[Vorsätze für Maßeinheiten|Vorsätze]] der Maßeinheiten in Großbuchstaben als Einheit angegeben werden, also K für KiB, M für MiB usw. Es gibt jedoch auch oft die Möglichkeit, SI-Einheiten zu wählen, dann in der korrekten, jedoch großgeschriebenen Einheit, also KB, MB usw.
 
Die in den 1980er und 1990er Jahren verbreitete 3,5-Zoll-[[Diskette]] verwendete eine binär-dezimale Mischform: die nominellen „1,44&nbsp;MB“ bedeuteten {{nowrap|1=1440 × 1024&nbsp;Byte}} = 1440&nbsp;KiB.
 
==== Vergleichstabelle ====
{{Byte}}
 
== Siehe auch ==
Zeile 122 ⟶ 123:
 
== Einzelnachweise ==
<references responsive >
<ref name="Bemer_1959">
{{cite journal |last=Bemer |first=Robert William |authorlink=Bob Bemer |year=1959 |title=A proposal for a generalized card code of 256 characters |journal=Communications of the ACM |volume=2 |issue=9 |pages=19–23 |doi=10.1145/368424.368435 |language=en}}
</ref>
<ref name="Bemer_2000">
Zeile 130 ⟶ 131:
</ref>
<ref name="Blaauw_1959">
{{cite journal |author=Gerrit Anne Blaauw, Frederick Phillips Brooks Jr., Werner Buchholz |title=Processing Data in Bits and Pieces |journal=IRE Transactions on Electronic Computers |pages=121 |date=1959-06 |language=en}}
</ref>
<ref name="Buchholz_1956_1">
Zeile 145 ⟶ 146:
</ref>
<ref name="Buchholz_1977">
{{cite journal |last=Buchholz |first=Werner |authorlink=Werner Buchholz (Ingenieur) |title=The Word „Byte“ Comes of Age... |journal=Byte Magazine |volume=2 |issue=2 |pages=144 |date=1977-02 |url=https://archive.org/stream/byte-magazine-1977-02/1977_02_BYTE_02-02_Usable_Systems#pages/n145/mode/2up |quote=[…] The first reference found in the files was contained in an internal memo written in June 1956 during the early days of developing Stretch. A byte was described as consisting of any number of parallel bits from one to six. Thus a byte was assumed to have a length appropriate for the occasion. Its first use was in the context of the input-output equipment of the 1950s, which handled six bits at a time. The possibility of going to 8 bit bytes was considered in August 1956 and incorporated in the design of Stretch shortly thereafter. The first published reference to the term occurred in 1959 in a paper „Processing Data in Bits and Pieces“ by [[Gerrit Blaauw|G&nbsp;A&nbsp;Blaauw]], [[Frederick P. Brooks|F&nbsp;P&nbsp;Brooks&nbsp;Jr]] and [[Werner Buchholz (Ingenieur)|W&nbsp;Buchholz]] in the ''IRE Transactions on Electronic Computers'', June 1959, pages 121. The notions of that paper were elaborated in Chapter 4 of ''Planning a Computer System (Project Stretch)'', edited by W&nbsp;Buchholz, McGraw-Hill Book Company (1962). The rationale for coining the term was explained there on pages 40 as follows:<br />Byte ''denotes a group of bits used to encode a character, or the number of bits transmitted in parallel to and from input-output units. A term other than ''character'' is used here because a given character may be represented in different applications by more than one code, and different codes may use different numbers of bits (ie, different byte sizes). In input-output transmission the grouping of bits may be completely arbitrary and have no relation to actual characters. (The term is coined from ''bite'', but respelled to avoid accidental mutation to ''bit''.)''<br />System/360 took over many of the Stretch concepts, including the basic byte and word sizes, which are powers of 2. For economy, however, the byte size was fixed at the 8 bit maximum, and addressing at the bit level was replaced by byte addressing. […] Since then the term byte has generally meant 8 bits, and it has thus passed into the general vocabulary. […] |language=en}}
</ref>
<ref name="C">
Zeile 156 ⟶ 157:
{{Internetquelle |autor=Eric Schäfer |url=http://www.maclife.de/news/betriebssystem/andere/dateigroessen-snow-leopard-zaehlt-anders |titel=Dateigrößen: Snow Leopard zählt anders. |werk=Mac Life |datum=2009-08-28 |abruf=2009-08-28}}
</ref>
<ref name="Philips">{{Internetquelle |url=http://www.intactvintage-reuniescalculators.nl/pdf/product1971Philips%20productoverzicht%201971.pdf |titel=Philips Data Systems’ product range – April 1971 |hrsg=Philips |datum=1971 |format=PDF; 4,8 MB |sprache=en |offline=ja |archiv-url=https://web.archive.org/web/20160304072023/http://www.intact-reunies.nl/pdf/product1971.pdf |archiv-datum=2016-03-04 |archiv-bot=2019-08-28 17:00:07 InternetArchiveBot |abruf=20152023-0809-03 |format=PDF10}}</ref>
<ref name="SI">
[https://www.bipm.org/en/publications/si-brochure ''Le Système international d’unités''.] 9e&nbsp;édition, 2019 (die sogenannte „SI-Broschüre“), Kapitel&nbsp;3, S.&nbsp;31 (französisch) und S.&nbsp;143 (englisch) – Randnotiz.