Eftersom datorn arbetar med bara siffror (1 och 0), så gör man en tabell där varje bokstav representeras av ett siffra, såsom A som representeras av 65. Viktigt att säga att det finns olika slags tabeller, en av de mest kända är ASCII, dessa tabeller kallas för encoding system. Unicode characters är ett teckenkodnings system av Encoding.
ASCII
ASCII som står för ”American Standard Code for information Interchange”, såsom namnet beskriver så är den tabellen gjord efter det amerikanska behovet, därför saknar ASCII tecken utöver (A-Z). Den tabellen är helt enkelt begränsad till 128 tecken och 32 kontroll tecken för att markera radslut och så vidare. Men nu för tiden så har de också skapat 8-bits ASCII, alltså en tabell med dubbelt så många tecken 256 stycken, mer än den vanliga ACSII, därför kallas den för ”NIS” eller ASCII komplett.
Decimal-binär-ASCII-konverteringsdiagram
Decimal | Binary | ASCII | Decimal | Binary | ASCII |
0 | 00000000 | NUL | 64 | 01000000 | @ |
1 | 00000001 | SOH | 65 | 01000001 | A |
2 | 00000010 | STX | 66 | 01000010 | B |
3 | 00000011 | ETX | 67 | 01000011 | C |
4 | 00000100 | EOT | 68 | 01000100 | D |
5 | 00000101 | ENQ | 69 | 01000101 | E |
6 | 00000110 | ACK | 70 | 01000110 | F |
7 | 00000111 | BEL | 71 | 01000111 | G |
8 | 00001000 | BS | 72 | 01001000 | H |
9 | 00001001 | HT | 73 | 01001001 | I |
10 | 00001010 | LF | 74 | 01001010 | J |
11 | 00001011 | VT | 75 | 01001011 | K |
12 | 00001100 | FF | 76 | 01001100 | L |
13 | 00001101 | CR | 77 | 01001101 | M |
14 | 00001110 | SO | 78 | 01001110 | N |
15 | 00001111 | SI | 79 | 01001111 | O |
16 | 00010000 | DLE | 80 | 01010000 | P |
17 | 00010001 | DC1 | 81 | 01010001 | Q |
18 | 00010010 | DC2 | 82 | 01010010 | R |
19 | 00010011 | DC3 | 83 | 01010011 | S |
20 | 00010100 | DC4 | 84 | 01010100 | T |
21 | 00010101 | NAK | 85 | 01010101 | U |
22 | 00010110 | SYN | 86 | 01010110 | V |
23 | 00010111 | ETB | 87 | 01010111 | X |
24 | 00011000 | CAN | 88 | 01011000 | W |
25 | 00011001 | EM | 89 | 01011001 | Y |
26 | 00011010 | SUB | 90 | 01011010 | Z |
27 | 00100001 | ! | 97 | 01100001 | a |
28 | 00100010 | ” | 98 | 01100010 | b |
29 | 00100011 | # | 99 | 01100011 | c |
30 | 00100100 | $ | 100 | 01100100 | d |
31 | 00100101 | % | 101 | 01100101 | e |
32 | 00100110 | & | 102 | 01100110 | f |
33 | 00100111 | ’ | 103 | 01100111 | g |
34 | 00101000 | ( | 104 | 01101000 | h |
35 | 00101001 | ) | 105 | 01101001 | i |
36 | 00101010 | * | 106 | 01101010 | j |
37 | 00101011 | + | 107 | 01101011 | k |
38 | 00101100 | , | 108 | 01101100 | l |
39 | 00101101 | – | 109 | 01101101 | m |
40 | 00101110 | . | 110 | 01101110 | n |
41 | 00101111 | / | 111 | 01101111 | o |
42 | 00110000 | 0 | 112 | 01110000 | p |
43 | 00110001 | 1 | 113 | 01110001 | q |
44 | 00110010 | 2 | 114 | 01110010 | r |
45 | 00110011 | 3 | 115 | 01110011 | s |
46 | 00110100 | 4 | 116 | 01110100 | t |
47 | 00110101 | 5 | 117 | 01110101 | u |
48 | 00110110 | 6 | 118 | 01110110 | v |
49 | 00110111 | 7 | 119 | 01110111 | w |
50 | 00111000 | 8 | 120 | 01111000 | x |
51 | 00111001 | 9 | 121 | 01111001 | y |
52 | 00111010 | : | 122 | 01111010 | z |
Unicode characters:
Ett problem med de flesta teckenkodningar är att man inte kan blanda olika språk med olika alfabet, därför utvecklades det ett heltäckande standard encodning, detta kallas för Unicode. Unicode står för Universal Character Set. Den senaste versionen av Unicode innehåller 100 000 tecken, det täcker ungefär 93 olika skriftsystem, matematiska symboler, tecken från spelkort och man kan till och med hitta ”Emoji”.
Hur använder man Unicode characters i HTML:
För att ange unicode encodning format i ett html dokument så ange man det i head taggen, genom att ange meta charset. Det finns olika typer av Unicode encodning system ”format” som man kan använda, såsom (Unicode Transformation Format) som förkortas med UTF det finns mellan 8-16-32 bits, men det som rekommenderas är UTF-8.
Efter att man har angett Transformation Format i Head taggen, är man nu redo att skriva tecken i HTML, det finns olika sätt för att skriva teckenkodningen i HTML, och de är :
1- Namngivna : Det är det lättaste sättet, man börjar med & ”och-tecken” och avslutar med semikolon (;), och i mellan av de två så skriver man nyckelord på det tecken man vill ha :
2. Numeriska: inte så stor skillnad i syntax från namngivna, den enda skillnaden är att man skriver # efter och-tecken &, så syntax ser ut så här:
3. Hexadecimala: syntax &#x sedan siffra och avsluta med semikolon.
För att använda Unicode tabell så finns det olika webbsidor som man kan använda sig av, en av de är Unicode.org , men det finns andra webbsidor också som innehåller Unicode tabell. Jag rekommenderar Compart eftersom den är tydlig och lätt att använda. Allt man behöver göra är att välja den symbolen man behöver, sedan kopierar man koden för den enskilda symbolen, därefter klistrar man den i sitt HTML dokument sen klistrar man in den koden där man behöver den symbolen.
Lämna ett svar