|
Latin-1
Zeichensatz, der die Sonderzeichen enthält, die in west-europäischen Sprachen verwendet werden.
Die internationale Organisation für Standardisierung, ISO, hat in den 1980er Jahren die ISO-8859-Standards für die Kodierungen von Schriftzeichen eingeführt. In ISO 8859-1, auch als "ISO Latin-1" bezeichnet, sind die Zeichen der nord- und west-europäischen Sprachen zusammengefasst. Dieser Zeichensatz umfasst neben den lateinischen Buchstaben, den arabischen Ziffern und zahlreichen Interpunktionszeichen auch die in den romanischen und germanischen Sprachen gebräuchlichen Sonderzeichen. In "Latin-1" können also zum Beispiel auch folgende Buchstaben, Ligaturen, Satzzeichen und diakritische Zeichen dargestellt werden:
- die deutschen und skandinavischen Umlaute (zum Beispiel Ä, Å, Æ, Ø)
- die diakritischen Zeichen aus dem Französischen (zum Beispiel ç, è, é, ô, ë)
- die Tilde aus den iberischen Sprachen Spanisch und Portugiesisch (zum Beispiel ñ, õ)
- Ligaturen wie das deutsche ß oder das skandinavische æ
- besondere Buchstaben, wie sie etwa im Isländischen verwendet werden (zum Beispiel Þ, þ, Ð und ð)
- besondere spanische (wie ¡, ¿) und französische Satzzeichen (wie «, »)
Der für das Internet wohl wichtigste Zeichensatz, der "American Standard Code for Information Interchange" (ASCII), enthält keine solchen Sonderzeichen. Da im ASCII nur 7 Bit für die Kodierung jedes Schriftzeichens verwendet werden, sind maximal 128 ASCII-Zeichen möglich. In "Latin-1" hingegen wird jedes Textzeichen mit 8 Bit kodiert, so dass immerhin 256 verschiedene Zeichen möglich sind. Die 'unteren' 128 Zeichen (die Zeichen mit den Nummern 0 bis 127) entsprechen dem ASCII. Die verschiedenen ISO 8859-Zeichensätze unterscheiden sich lediglich in den 'oberen' Zeichen (den Zeichen mit den Nummern 160 bis 255) voneinander.
Während der Zeichensatz "ISO Latin-1" (ISO 8859-1) die in den west-europäischen Sprachen gebräuchlichen Buchstaben und Sonderzeichen umfasst, stellt "ISO Latin-2" (ISO 8859-2) die Buchstaben und diakritischen Zeichen für ost-europäische Sprachen zur Verfügung, die mit lateinischen Buchstaben geschrieben werden. Für europäische Sprachen wie Russisch, Bulgarisch und Griechisch, die nicht in lateinischer Schrift geschrieben werden, hat die ISO eigene Zeichensätze festgelegt.
Der Zeichensatz "ISO Latin-1" für die west-europäischen Sprachen entspricht der Codepage 850. Der Zeichensatz "ISO Latin-2" für die ost-europäischen Sprachen, die im lateinischen Alphabet geschreiben werden, entspricht der Codepage 852.
Zeichen-Nr./ Unicode dez. |
Zeichen |
HTML-Entity |
Bezeichnung |
|   |
|
|
Leerschritt ohne Zeilenumbruch |
| ¡ |
¡ |
¡ |
umgekehrtes Ausrufungszeichen |
| ¢ |
¢ |
¢ |
Cent-Zeichen (Währungszeichen) |
| £ |
£ |
£ |
Pfund-Zeichen (Brit. Pfund Sterling; Währungszeichen) |
| ¤ |
¤ |
¤ |
Allgemeines Währungszeichen |
| ¥ |
¥ |
¥ |
Yen-Zeichen (Währungszeichen) |
| ¦ |
¦ |
¦ |
Unterbrochener senkrechter Strich |
| § |
§ |
§ |
Paragraphen-Zeichen |
| ¨ |
¨ |
¨ |
Diaeresis (Trema) |
| © |
© |
© |
Copyright-Zeichen |
| ª |
ª |
ª |
Weibliche Ordnungszahl |
| « |
« |
« |
Spitze Anführungszeichen links (Guillemets) |
| ¬ |
¬ |
¬ |
"Nicht"-Zeichen, Verneinungszeichen |
| ­ |
|
­ |
Bedingter Trennstrich |
| ® |
® |
® |
Eingetragene Marke |
| ¯ |
¯ |
¯ |
Macron |
| ° |
° |
° |
Grad-Zeichen |
| ± |
± |
± |
Plus-Minus-Zeichen, Toleranz-Zeichen |
| ² |
² |
² |
hoch 2, zum Quadrat |
| ³ |
³ |
³ |
hoch 3, Kubik |
| ´ |
´ |
´ |
Akut; accent aigu |
| µ |
µ |
µ |
Mikro-Zeichen |
| ¶ |
¶ |
¶ |
Absatzzeichen |
| · |
· |
· |
Punkt in der Mitte |
| ¸ |
¸ |
¸ |
Cedilla |
| ¹ |
¹ |
¹ |
hoch 1 |
| º |
º |
º |
männliche Ordnungszahl |
| » |
» |
» |
Spitze Anführungszeichen rechts (Guillemets) |
| ¼ |
¼ |
¼ |
ein Viertel |
| ½ |
½ |
½ |
einhalb |
| ¾ |
¾ |
¾ |
drei Viertel |
| ¿ |
¿ |
¿ |
umgekehrtes Fragezeichen |
| À |
À |
À |
Großes A mit Grave |
| Á |
Á |
Á |
Großes A mit Akut |
| Â |
 |
 |
Großes A mit Zirkumflex |
| Ã |
à |
à |
Großes A mit Tilde |
| Ä |
Ä |
Ä |
Großes A mit Diaeresis (Umlaut) |
| Å |
Å |
Å |
Großes A mit Ring (Krouzek) |
| Æ |
Æ |
Æ |
Ligatur aus großem A und großem E |
| Ç |
Ç |
Ç |
Großes C mit Cedilla |
| È |
È |
È |
Großes E mit Grave |
| É |
É |
É |
Großes E mit Akut |
| Ê |
Ê |
Ê |
Großes E mit Zirkumflex |
| Ë |
Ë |
Ë |
Großes E mit Diaeresis (Trema) |
| Ì |
Ì |
Ì |
Großes I mit Grave |
| Í |
Í |
Í |
Großes I mit Akut |
| Î |
Î |
Î |
Großes I mit Zirkumflex |
| Ï |
Ï |
Ï |
Großes I mit Diaeresis (Trema) |
| Ð |
Ð |
Ð |
Großes Eth |
| Ñ |
Ñ |
Ñ |
Großes N mit Tilde |
| Ò |
Ò |
Ò |
Großes O mit Grave |
| Ó |
Ó |
Ó |
Großes O mit Akut |
| Ô |
Ô |
Ô |
Großes O mit Zirkumflex |
| Õ |
Õ |
Õ |
Großes O mit Tilde |
| Ö |
Ö |
Ö |
Großes O mit Diaeresis (Umlaut) |
| × |
× |
× |
mal, Multiplikationszeichen |
| Ø |
Ø |
Ø |
Großes O mit Schrägstrich |
| Ù |
Ù |
Ù |
Goßes U mit Grave |
| Ú |
Ú |
Ú |
Großes U mit Akut |
| Û |
Û |
Û |
Großes U mit Zirkumflex |
| Ü |
Ü |
Ü |
Großes U mit Diaeresis (Umlaut) |
| Ý |
Ý |
Ý |
Großes Y mit Akut |
| Þ |
Þ |
Þ |
Großes Thorn |
| ß |
ß |
ß |
Esszett, Ligatur aus kleinem s und kleinem z; deutsches scharfes s |
| à |
à |
à |
Kleines a mit Grave |
| á |
á |
á |
Kleines a mit Akut |
| â |
â |
â |
Kleines a mit Zirkumflex |
| ã |
ã |
ã |
Kleines a mit Tilde |
| ä |
ä |
ä |
Kleines a mit Diaeresis (Umlaut) |
| å |
å |
å |
Kleines a mit Ring (Krouzek) |
| æ |
æ |
æ |
Ligatur aus kleinem a und kleinem e |
| ç |
ç |
ç |
Kleines c mit Cedilla |
| è |
è |
è |
Kleines e mit Grave |
| é |
é |
é |
Kleines e mit Akut |
| ê |
ê |
ê |
Kleines e mit Zirkumflex |
| ë |
ë |
ë |
Kleines e mit Diaeresis (Trema) |
| ì |
ì |
ì |
Kleines i mit Grave |
| í |
í |
í |
Kleines i mit Akut |
| î |
î |
î |
Kleines i mit Zirkumflex |
| ï |
ï |
ï |
Kleines i mit Diaeresis (Trema) |
| ð |
ð |
ð |
Kleines eth |
| ñ |
ñ |
ñ |
Kleines n mit Tilde |
| ò |
ò |
ò |
Kleines o mit Grave |
| ó |
ó |
ó |
Kleines o mit Akut |
| ô |
ô |
ô |
Kleines o mit Zirkumflex |
| õ |
õ |
õ |
Kleines o mit Tilde |
| ö |
ö |
ö |
Kleines o mit Diaeresis (Umlaut) |
| ÷ |
÷ |
÷ |
Geteilt durch (Divisionszeichen) |
| ø |
ø |
ø |
Kleines o mit Schrägstrich |
| ù |
ù |
ù |
Kleines u mit Grave |
| ú |
ú |
ú |
Kleines u mit Akut |
| û |
û |
û |
Kleines u mit Zirkumflex |
| ü |
ü |
ü |
Kleines u mit Diaeresis (Umlaut) |
| ý |
ý |
ý |
Kleines y mit Akut |
| þ |
þ |
þ |
Kleines thorn |
| ÿ |
ÿ |
ÿ |
Kleines y mit Diaeresis |
Die Ordnungszahl der Zeichen (der Codepoint) stimmt im ISO-Latin 1-Zeichensatz mit der Unicode-Nummer des betreffenden Zeichens überein.
Der Latin-1-Zeichensatz deckt den Zeichenbedarf der meisten west-europäischen Sprachen ab; darunter:
- Albanisch
- Afrikaans
- Baskisch
- Dänisch
- Deutsch
- Englisch
- Färörisch (Färingisch)
- Finnisch
- Französisch
- Galizisch
- Irisch (Gälisch)
- Isländisch
- Italienisch
- Katalanisch
- Niederländisch (Flämisch)
- Norwegisch
- Portugiesisch
- Schwedisch
- Spanisch (Castellano)
- Schottisch
Es fehlen allerdings die Ligaturen für ij (Niederländisch) und oe (Französisch) sowie die im deutschen verwendeten, gekrümmten Anführungsstriche unten ("Gänsefüßchen").
ISO Latin-1 wurde aus dem "Multinational Character Set" von DEC abgeleitet. Der Zeichenvorrat dieses "Character Encoding Schemes" (CES) entspricht dem des Unicode-Skripts "C1 Controls and Latin-1 Supplement" (ISO 10646).
 Druckversion
|