본문 바로가기

HTML 인코딩 (문자 집합)|(HTML Encoding (Character Sets))


To display an HTML page correctly, a web browser must know which character set (character encoding) to use.

HTML 페이지를 올바르게 표시하려면 웹 브라우저가 사용할 문자 집합 (문자 인코딩)을 알아야합니다.



What is Character Encoding?

문자 인코딩이란 무엇입니까?


ASCII was the first character encoding standard (also called character set). 

ASCII는 첫 번째 문자 인코딩 표준 (문자 집합이라고도 함)입니다.

ASCII defined 128 different alphanumeric characters that could be used on the internet: numbers (0-9), English letters (A-Z), and some special characters like ! 

ASCII는 숫자 (0-9), 영문자 (AZ) 및 일부 특수 문자와 같이 인터넷에서 사용할 수있는 128 개의 다른 영숫자를 정의했습니다. 


$ + - () @ <>.


ANSI (Windows-1252) was the original Windows character set, with support for 256 different character codes.

ANSI (Windows-1252)는 원래의 Windows 문자 집합으로 256 가지 문자 코드를 지원합니다.

ISO-8859-1 was the default character set for HTML 4. This character set also supported 256 different character codes.

ISO-8859-1은 HTML 4의 기본 문자 집합입니다.이 문자 집합은 256 개의 다른 문자 코드도 지원합니다.

Because ANSI and ISO-8859-1 were so limited, HTML 4 also supported UTF-8.

ANSI와 ISO-8859-1은 매우 제한적 이었기 때문에 HTML 4도 UTF-8을 지원했습니다.


UTF-8 (Unicode) covers almost all of the characters and symbols in the world.

UTF-8 (유니 코드)은 세계의 거의 모든 문자와 기호를 포함합니다.


The default character encoding for HTML5 is UTF-8.

HTML5의 기본 문자 인코딩은 UTF-8입니다.



The HTML charset Attribute

HTML charset 특성


To display an HTML page correctly, a web browser must know the character set used in the page.

HTML 페이지를 올바르게 표시하려면 웹 브라우저가 페이지에서 사용 된 문자 집합을 알아야합니다.

This is specified in the <meta> tag:

<meta>태그에 지정됩니다 .


For HTML4:

1
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
cs


For HTML5:

1
<meta charset="UTF-8">
cs


If a browser detects ISO-8859-1 in a web page, it defaults to ANSI, because ANSI is identical to ISO-8859-1 except that ANSI has 32 extra characters.

브라우저가 웹 페이지에서 ISO-8859-1을 발견하면 ANSI는 ISO-8859-1과 동일하므로 ANSI는 32 자의 추가 문자를 갖기 때문에 기본값은 ANSI입니다.



Differences Between Character Sets

문자 집합 간의 차이점


The following table displays the differences between the character sets described above:

다음 표는 위에 설명 된 문자 집합 간의 차이점을 보여줍니다.


Numb ASCII ANSI 8859 UTF-8 Description
32 space
33!!!!exclamation mark
34""""quotation mark
35####number sign
36$$$$dollar sign
37%%%%percent sign
38&&&&ampersand
39''''apostrophe
40((((left parenthesis
41))))right parenthesis
42****asterisk
43++++plus sign
44,,,,comma
45----hyphen-minus
46....full stop
47////solidus
480000digit zero
491111digit one
502222digit two
513333digit three
524444digit four
535555digit five
546666digit six
557777digit seven
568888digit eight
579999digit nine
58::::colon
59;;;;semicolon
60<<<<less-than sign
61====equals sign
62>>>>greater-than sign
63????question mark
64@@@@commercial at
65AAAALatin capital letter A
66BBBBLatin capital letter B
67CCCCLatin capital letter C
68DDDDLatin capital letter D
69EEEELatin capital letter E
70FFFFLatin capital letter F
71GGGGLatin capital letter G
72HHHHLatin capital letter H
73IIIILatin capital letter I
74JJJJLatin capital letter J
75KKKKLatin capital letter K
76LLLLLatin capital letter L
77MMMMLatin capital letter M
78NNNNLatin capital letter N
79OOOOLatin capital letter O
80PPPPLatin capital letter P
81QQQQLatin capital letter Q
82RRRRLatin capital letter R
83SSSSLatin capital letter S
84TTTTLatin capital letter T
85UUUULatin capital letter U
86VVVVLatin capital letter V
87WWWWLatin capital letter W
88XXXXLatin capital letter X
89YYYYLatin capital letter Y
90ZZZZLatin capital letter Z
91[[[[left square bracket
92\\\\reverse solidus
93]]]]right square bracket
94^^^^circumflex accent
95____low line
96````grave accent
97aaaaLatin small letter a
98bbbbLatin small letter b
99ccccLatin small letter c
100ddddLatin small letter d
101eeeeLatin small letter e
102ffffLatin small letter f
103ggggLatin small letter g
104hhhhLatin small letter h
105iiiiLatin small letter i
106jjjjLatin small letter j
107kkkkLatin small letter k
108llllLatin small letter l
109mmmmLatin small letter m
110nnnnLatin small letter n
111ooooLatin small letter o
112ppppLatin small letter p
113qqqqLatin small letter q
114rrrrLatin small letter r
115ssssLatin small letter s
116ttttLatin small letter t
117uuuuLatin small letter u
118vvvvLatin small letter v
119wwwwLatin small letter w
120xxxxLatin small letter x
121yyyyLatin small letter y
122zzzzLatin small letter z
123{{{{left curly bracket
124||||vertical line
125}}}}right curly bracket
126~~~~tilde
127DEL    
128   euro sign
129 NOT USED
130   single low-9 quotation mark
131 ƒ  Latin small letter f with hook
132   double low-9 quotation mark
133   horizontal ellipsis
134   dagger
135   double dagger
136 ˆ  modifier letter circumflex accent
137   per mille sign
138 Š  Latin capital letter S with caron
139   single left-pointing angle quotation mark
140 Œ  Latin capital ligature OE
141 NOT USED
142 Ž  Latin capital letter Z with caron
143 NOT USED
144 NOT USED
145   left single quotation mark
146   right single quotation mark
147   left double quotation mark
148   right double quotation mark
149   bullet
150   en dash
151   em dash
152 ˜  small tilde
153   trade mark sign
154 š  Latin small letter s with caron
155   single right-pointing angle quotation mark
156 œ  Latin small ligature oe
157 NOT USED
158 ž  Latin small letter z with caron
159 Ÿ  Latin capital letter Y with diaeresis
160    no-break space
161 ¡¡¡inverted exclamation mark
162 ¢¢¢cent sign
163 £££pound sign
164 ¤¤¤currency sign
165 ¥¥¥yen sign
166 ¦¦¦broken bar
167 §§§section sign
168 ¨¨¨diaeresis
169 ©©©copyright sign
170 ªªªfeminine ordinal indicator
171 «««left-pointing double angle quotation mark
172 ¬¬¬not sign
173 ­­­soft hyphen
174 ®®®registered sign
175 ¯¯¯macron
176 °°°degree sign
177 ±±±plus-minus sign
178 ²²²superscript two
179 ³³³superscript three
180 ´´´acute accent
181 µµµmicro sign
182 pilcrow sign
183 ···middle dot
184 ¸¸¸cedilla
185 ¹¹¹superscript one
186 ºººmasculine ordinal indicator
187 »»»right-pointing double angle quotation mark
188 ¼¼¼vulgar fraction one quarter
189 ½½½vulgar fraction one half
190 ¾¾¾vulgar fraction three quarters
191 ¿¿¿inverted question mark
192 ÀÀÀLatin capital letter A with grave
193 ÁÁÁLatin capital letter A with acute
194 ÂÂÂLatin capital letter A with circumflex
195 ÃÃÃLatin capital letter A with tilde
196 ÄÄÄLatin capital letter A with diaeresis
197 ÅÅÅLatin capital letter A with ring above
198 ÆÆÆLatin capital letter AE
199 ÇÇÇLatin capital letter C with cedilla
200 ÈÈÈLatin capital letter E with grave
201 ÉÉÉLatin capital letter E with acute
202 ÊÊÊLatin capital letter E with circumflex
203 ËËËLatin capital letter E with diaeresis
204 ÌÌÌLatin capital letter I with grave
205 ÍÍÍLatin capital letter I with acute
206 ÎÎÎLatin capital letter I with circumflex
207 ÏÏÏLatin capital letter I with diaeresis
208 ÐÐÐLatin capital letter Eth
209 ÑÑÑLatin capital letter N with tilde
210 ÒÒÒLatin capital letter O with grave
211 ÓÓÓLatin capital letter O with acute
212 ÔÔÔLatin capital letter O with circumflex
213 ÕÕÕLatin capital letter O with tilde
214 ÖÖÖLatin capital letter O with diaeresis
215 ×××multiplication sign
216 ØØØLatin capital letter O with stroke
217 ÙÙÙLatin capital letter U with grave
218 ÚÚÚLatin capital letter U with acute
219 ÛÛÛLatin capital letter U with circumflex
220 ÜÜÜLatin capital letter U with diaeresis
221 ÝÝÝLatin capital letter Y with acute
222 ÞÞÞLatin capital letter Thorn
223 ßßßLatin small letter sharp s
224 àààLatin small letter a with grave
225 áááLatin small letter a with acute
226 âââLatin small letter a with circumflex
227 ãããLatin small letter a with tilde
228 äääLatin small letter a with diaeresis
229 åååLatin small letter a with ring above
230 æææLatin small letter ae
231 çççLatin small letter c with cedilla
232 èèèLatin small letter e with grave
233 éééLatin small letter e with acute
234 êêêLatin small letter e with circumflex
235 ëëëLatin small letter e with diaeresis
236 ìììLatin small letter i with grave
237 íííLatin small letter i with acute
238 îîîLatin small letter i with circumflex
239 ïïïLatin small letter i with diaeresis
240 ðððLatin small letter eth
241 ñññLatin small letter n with tilde
242 òòòLatin small letter o with grave
243 óóóLatin small letter o with acute
244 ôôôLatin small letter o with circumflex
245 õõõLatin small letter o with tilde
246 öööLatin small letter o with diaeresis
247 ÷÷÷division sign
248 øøøLatin small letter o with stroke
249 ùùùLatin small letter u with grave
250 úúúLatin small letter u with acute
251 ûûûLatin small letter with circumflex
252 üüüLatin small letter u with diaeresis
253 ýýýLatin small letter y with acute
254 þþþLatin small letter thorn
255 ÿÿÿLatin small letter y with diaeresis



The ASCII Character Set

ASCII 문자 세트


ASCII uses the values from 0 to 31 (and 127) for control characters.

ASCII는 제어 문자에 0에서 31 (및 127) 사이의 값을 사용합니다.

ASCII uses the values from 32 to 126 for letters, digits, and symbols.

ASCII는 문자, 숫자 및 기호에 32에서 126 사이의 값을 사용합니다.

ASCII does not use the values from 128 to 255.

ASCII는 128에서 255까지의 값을 사용하지 않습니다.



The ANSI Character Set (Windows-1252)

ANSI 문자 집합 (Windows-1252)


ANSI is identical to ASCII for the values from 0 to 127.

ANSI는 0에서 127 사이의 값에 대해 ASCII와 동일합니다.

ANSI has a proprietary set of characters for the values from 128 to 159.

ANSI는 128에서 159 사이의 값에 대해 독점적 인 문자 집합을 사용합니다.

ANSI is identical to UTF-8 for the values from 160 to 255.

ANSI는 160에서 255 사이의 값에 대해 UTF-8과 동일합니다.



The ISO-8859-1 Character Set

ISO-8859-1 문자 세트


8859-1 is identical to ASCII for the values from 0 to 127.

8859-1은 0에서 127 사이의 값에 대해 ASCII와 동일합니다.

8859-1 does not use the values from 128 to 159.

8859-1은 128에서 159까지의 값을 사용하지 않습니다.

8859-1 is identical to UTF-8 for the values from 160 to 255.

8859-1은 160에서 255 사이의 값에 대해 UTF-8과 동일합니다.



The UTF-8 Character Set

UTF-8 문자 세트


UTF-8 is identical to ASCII for the values from 0 to 127.

UTF-8은 0에서 127까지의 값에 대해 ASCII와 동일합니다.

UTF-8 does not use the values from 128 to 159. 

UTF-8은 128에서 159 사이의 값을 사용하지 않습니다. 

UTF-8 is identical to both ANSI and 8859-1 for the values from 160 to 255.

UTF-8은 160에서 255 사이의 값에 대해 ANSI 및 8859-1과 동일합니다.

UTF-8 continues from the value 256 with more than 10 000 different characters.

UTF-8은 값이 256에서 10000 개 이상의 다른 문자까지 계속됩니다.

For a closer look, study our Complete HTML Character Set Reference.

더 자세히 보시려면 완전한 HTML 문자 세트 참조 서를 읽어보십시오 .



The @charset CSS Rule

@charset CSS 규칙


You can use the CSS @charset rule to specify the character encoding used in a style sheet:

CSS @charset규칙을 사용하여 스타일 시트에 사용 된 문자 인코딩을 지정할 수 있습니다 .


Example

Set the encoding of the style sheet to Unicode UTF-8:

스타일 시트의 인코딩을 유니 코드 UTF-8로 설정합니다.


1
@charset "UTF-8";
cs


Read more about the CSS @charset Rule in our CSS Reference.

CSS Reference에서 CSS @charset 규칙에 대해 더 자세히 읽어보십시오 .



출처 : w3schools.com


'HTML' 카테고리의 다른 글

[R]HTML 과 XHTML(HTML and XHTML)  (0) 2018.07.01
[R]HTML Uniform Resource Locators  (1) 2018.06.30
HTML 기호(HTML Symbols)  (0) 2018.06.28
HTML 개체(HTML Entities)  (0) 2018.06.27
HTML 컴퓨터 코드 요소(HTML Computer Code Elements)  (0) 2018.06.26