ASCII
ASCII (American Standard Code for Information Interchange) es un collection de characteres e un codification de characteres basate super le alphabeto roman secundo le uso del anglese moderne. Illo es usate per computatores e altere equipamentos de communication pro representar texto e per apparatos de controlo que opera con texto.
ASCII |
---|
instantia de: Codification de characteres, coded character set[*], Unicode range[*], technical standard[*] |
|
, succedite per: ISO/IEC 8859[*], ISO/IEC 646[*] |
Commons: ASCII |
Como altere codices, ASCII specifica un correspondentia inter numeros integre que pote esser representate digitalmente e le symbolos de un lingua scripte, permittente que apparatos digital communica inter se e processa e immagazina information de natura textual. Le codification de characteres ASCII (o un extension compatibile; vide infra) es usate in quasi tote computatores commun, specialmente in computatores personal e stationes de travalio. Le denomination MIME preferite pro iste codification es "US-ASCII".
ASCII es un codice de septe bits, lo que significa que illo usa numeros integre representabile con septe digitos binari (un gamma de 0 a 127 in decimal) pro representar information. Mesmo in le epocha del introduction del ASCII, le majoritate del computatores operava con bytes de octo bits como le minor unitate de information; le octave bit communmente era usate pro controlo de errores in lineas de communication o altere functiones in apparatos specific.
ASCII non specifica ulle maniera de representar informatoin super le structura o apparentia de un fragmento de texto. Isto require le uso de un linguage de marcation.
ASCII esseva publicate como un standard in 1963 per le American Standards Association (ASA), que posteriormente deveniva ANSI. Il habeva multe variationes de ASCII, mais su forma actual e plus disseminate es ANSI X3.4-1967, equalmente standardisate como ECMA-6, ISO/IEC 664:1991 International Reference Version, e ITU-T Recommendation T.50 (09/92). ASCII es considerate generalmente como le standard de software le plus successose jammais promulgate.
Characteres de controlo ASCII
modificarLe prime trenta-duo codices (numeros 0—31 in decimal) de ASCII es reservate pro characteres de controlo que pote non representar information in se, mais es usate pro controlar apparatos (como impressores) que utilisa ASCII. Per exemplo, le character 10 representa le function "Line Feed" ("avantiamento de linea", que face le impressor avantiar le papiro), e le character 27 representa le clave "Escape" trovate in le angulo superior sinistre de clavieros commun.
Le codice 127 (tote le septe bits accendite) es un altere character special cognite como "Delete". Ben que su function es similar a illo de altere characteres de controlo, illo esseva placiate in su position a fin que illo poterea esser usate pro cancellar un section de banda perforate, un medio de immagazinage popular in le passato, per perforar tote su foramines.
Binario | Decimal | Hex | Abbreviation | Representation imprimibile | Nomine / Significato |
---|---|---|---|---|---|
0000 0000 | 0 | 00 | NUL | ␀ | Null character |
0000 0001 | 1 | 01 | SOH | ␁ | Start of Header |
0000 0010 | 2 | 02 | STX | ␂ | Start of Text |
0000 0011 | 3 | 03 | ETX | ␃ | End of Text |
0000 0100 | 4 | 04 | EOT | ␄ | End of Transmission |
0000 0101 | 5 | 05 | ENQ | ␅ | Enquiry |
0000 0110 | 6 | 06 | ACK | ␆ | Acknowledgment |
0000 0111 | 7 | 07 | BEL | ␇ | Bell |
0000 1000 | 8 | 08 | BS | ␈ | Backspace |
0000 1001 | 9 | 09 | HT | ␉ | Horizontal Tab |
0000 1010 | 10 | 0A | LF | ␊ | Line Feed |
0000 1011 | 11 | 0B | VT | ␋ | Vertical Tab |
0000 1100 | 12 | 0C | FF | ␌ | Form Feed |
0000 1101 | 13 | 0D | CR | ␍ | Carriage Return |
0000 1110 | 14 | 0E | SO | ␎ | Shift Out |
0000 1111 | 15 | 0F | SI | ␏ | Shift In |
0001 0000 | 16 | 10 | DLE | ␐ | Data Link Escape |
0001 0001 | 17 | 11 | DC1 | ␑ | XON Device Control 1 |
0001 0010 | 18 | 12 | DC2 | ␒ | Device Control 2 |
0001 0011 | 19 | 13 | DC3 | ␓ | XOFF Device Control 3 |
0001 0100 | 20 | 14 | DC4 | ␔ | Device Control 4 |
0001 0101 | 21 | 15 | NAK | ␕ | Negative Acknowledgement |
0001 0110 | 22 | 16 | SYN | ␖ | Synchronous Idle |
0001 0111 | 23 | 17 | ETB | ␗ | End of Trans. Block |
0001 1000 | 24 | 18 | CAN | ␘ | Cancel |
0001 1001 | 25 | 19 | EM | ␙ | End of Medium |
0001 1010 | 26 | 1A | SUB | ␚ | Substitute |
0001 1011 | 27 | 1B | ESC | ␛ | Escape |
0001 1100 | 28 | 1C | FS | ␜ | File Separator |
0001 1101 | 29 | 1D | GS | ␝ | Group Separator |
0001 1110 | 30 | 1E | RS | ␞ | Record Separator |
0001 1111 | 31 | 1F | US | ␟ | Unit Separator |
0111 1111 | 127 | 7F | DEL | ␡ | Delete |
In le tabella supra, le quinte columna contine characteres graphic que es reservate pro representar le position de codices de controlo in un fluxo de datos; tu agente de usator HTML pote requirer le installation de fontes additional a fin de exhibir los.
Softwares utilitari e systemas de operation ha varie conventiones pro representar le fin de un linea de texto. Le majoritate usa o LF o CR individualmente, o CR sequite per LF. Quando un SO immagazina texto in un file usante ASCII o un codification compatibile de 8 bits, iste characteres es representate per lor bytes 0A, 0D, o 0D sequite per 0A, respectivemente. In EBCDIC, le codice "Next Line" (NEL) al byte 15 (hex) es le typic character de fin de linea. ASCII non del toto codifica NEL, le byte 15 in illo es NAK. Le tabella sequente demonstra le variationes in le conventiones de fin de linea inter differente SOs:
Systema de Operation | Character(es) |
---|---|
AIX | NEL |
CP/M and MP/M | CR LF |
Cygwin | LF o CR LF* |
Mac OS usque a 9.x | CR |
Mac OS X | LF |
Windows | CR LF |
MS-DOS | CR LF |
OS/390 | NEL |
Unix, Xenix | LF |
VMS Ha multe formatos de file de texto. Le formato predefinite es "Variable Length Record". Le formato es specificate per le campo "Record format" del registro del file in le directorio. | Variable Length Record, CR LF, CR, LF, Fixed Length Record, etc. |
X Window System** | LF |
* Depende de como illo era installate. ** Mesmo in execution super Microsoft Windows.
Characteres imprimibile ASCII
modificarLe codice 32 es le character de spatio, denotante le spatio inter parolas, que es producite per le grande barra de spatio de un claviero. Le codices de 33 a 126 es appellate characteres imprimite, que representa litteras, digitos, signos de punctuation e alcun symbolos miscellanee.
Binario | Decimal | Hex | Graphico |
---|---|---|---|
0010 0000 | 32 | 20 | (spatio in blanco) |
0010 0001 | 33 | 21 | ! |
0010 0010 | 34 | 22 | " |
0010 0011 | 35 | 23 | # |
0010 0100 | 36 | 24 | $ |
0010 0101 | 37 | 25 | % |
0010 0110 | 38 | 26 | & |
0010 0111 | 39 | 27 | ' |
0010 1000 | 40 | 28 | ( |
0010 1001 | 41 | 29 | ) |
0010 1010 | 42 | 2A | * |
0010 1011 | 43 | 2B | + |
0010 1100 | 44 | 2C | , |
0010 1101 | 45 | 2D | - |
0010 1110 | 46 | 2E | . |
0010 1111 | 47 | 2F | / |
0011 0000 | 48 | 30 | 0 |
0011 0001 | 49 | 31 | 1 |
0011 0010 | 50 | 32 | 2 |
0011 0011 | 51 | 33 | 3 |
0011 0100 | 52 | 34 | 4 |
0011 0101 | 53 | 35 | 5 |
0011 0110 | 54 | 36 | 6 |
0011 0111 | 55 | 37 | 7 |
0011 1000 | 56 | 38 | 8 |
0011 1001 | 57 | 39 | 9 |
0011 1010 | 58 | 3A | : |
0011 1011 | 59 | 3B | ; |
0011 1100 | 60 | 3C | < |
0011 1101 | 61 | 3D | = |
0011 1110 | 62 | 3E | > |
0011 1111 | 63 | 3F | ? |
Binario | Decimal | Hex | Graphico |
---|---|---|---|
0100 0000 | 64 | 40 | @ |
0100 0001 | 65 | 41 | A |
0100 0010 | 66 | 42 | B |
0100 0011 | 67 | 43 | C |
0100 0100 | 68 | 44 | D |
0100 0101 | 69 | 45 | E |
0100 0110 | 70 | 46 | F |
0100 0111 | 71 | 47 | G |
0100 1000 | 72 | 48 | H |
0100 1001 | 73 | 49 | I |
0100 1010 | 74 | 4A | J |
0100 1011 | 75 | 4B | K |
0100 1100 | 76 | 4C | L |
0100 1101 | 77 | 4D | M |
0100 1110 | 78 | 4E | N |
0100 1111 | 79 | 4F | O |
0101 0000 | 80 | 50 | P |
0101 0001 | 81 | 51 | Q |
0101 0010 | 82 | 52 | R |
0101 0011 | 83 | 53 | S |
0101 0100 | 84 | 54 | T |
0101 0101 | 85 | 55 | U |
0101 0110 | 86 | 56 | V |
0101 0111 | 87 | 57 | W |
0101 1000 | 88 | 58 | X |
0101 1001 | 89 | 59 | Y |
0101 1010 | 90 | 5A | Z |
0101 1011 | 91 | 5B | [ |
0101 1100 | 92 | 5C | \ |
0101 1101 | 93 | 5D | ] |
0101 1110 | 94 | 5E | ^ |
0101 1111 | 95 | 5F | _ |
Binario | Decimal | Hex | Graphico |
---|---|---|---|
0110 0000 | 96 | 60 | ` |
0110 0001 | 97 | 61 | a |
0110 0010 | 98 | 62 | b |
0110 0011 | 99 | 63 | c |
0110 0100 | 100 | 64 | d |
0110 0101 | 101 | 65 | e |
0110 0110 | 102 | 66 | f |
0110 0111 | 103 | 67 | g |
0110 1000 | 104 | 68 | h |
0110 1001 | 105 | 69 | i |
0110 1010 | 106 | 6A | j |
0110 1011 | 107 | 6B | k |
0110 1100 | 108 | 6C | l |
0110 1101 | 109 | 6D | m |
0110 1110 | 110 | 6E | n |
0110 1111 | 111 | 6F | o |
0111 0000 | 112 | 70 | p |
0111 0001 | 113 | 71 | q |
0111 0010 | 114 | 72 | r |
0111 0011 | 115 | 73 | s |
0111 0100 | 116 | 74 | t |
0111 0101 | 117 | 75 | u |
0111 0110 | 118 | 76 | v |
0111 0111 | 119 | 77 | w |
0111 1000 | 120 | 78 | x |
0111 1001 | 121 | 79 | y |
0111 1010 | 122 | 7A | z |
0111 1011 | 123 | 7B | { |
0111 1100 | 124 | 7C | | |
0111 1101 | 125 | 7D | } |
0111 1110 | 126 | 7E | ~ |
Nota que le characteres majuscule pote esser convertite in minuscule per le addition de 32 a lor valores ASCII; in binario, isto pote esser obtenite simplemente per definir le sexte bit minus significante como 1.
Variantes de ASCII
modificarLe dissemination international del informatica ha provocate le apparition de multe variationes e extensiones del collection de characteres ASCII, viste que ASCII non include litteras accentuate e altere symbolos necessari pro scriber le majoritate del linguas que usa alphabetos de base roman. Le standard international ISO 646 (1972) esseva le prime tentativa de remediar iste problema, ben que illo infortunatemente creava simultaneemente problemas de compatibilitate. ISO 646 esseva ancora un collection de characteres de septe bits, e viste que il non habeva codices additional disponibile, alcunes esseva reassignate in variantes pro linguas specific. Per exemplo, le codice ASCII 93 (le parenthese quadrate dextere "]") es usate in le variante german ISO 646-DE pro le littera majuscule U con dierese (Ü), e in le variante danese ISO 646-DK pro le littera majuscule A con anello (Å).
Meliorationes technologic apportava manieras de representar exteriormente le information previemente codificate in le octave bit de cata byte, liberante iste bit pro componer 128 codices de character additional pro nove assignationes. Standards de octo bits tal como ISO 8859 possibilitava le representation de un gamma plus large de linguas, mais le incompatibilitates e limitationes persisteva. ISO 8859-1 e le original ASCII de 7 bits es le plus commun codificationes de characteres in uso hodie, ben que Unicode (con un collection de characteres multo plus grande) rapidemente deveni standard in multe locos. Iste codices plus recente es retrocompatibilitate, isto es, le prime 127 positiones de cata codice es identic al ASCII, e le prime 256 positiones de Unicode es identic al ISO 8859-1.
Le parola anglese "ASCIIbetical" describe le ordination de datos in le ordine de ASCII in vice del ordine alphabetic genuine (que require un computation ingeniose, e varia secundo le lingua in question).