Windows-1252
(CP1252에서 넘어옴)
Windows-1252 또는 CP-1252 또는 코드페이지 1252(Code Page 1252)는 영어 및 스페인어, 프랑스어 및 독일어를 포함한 많은 유럽 언어 용 마이크로소프트(Microsoft) 윈도우즈(Windows)의 레거시 구성 요소에서 기본적으로 사용되는 라틴 알파벳의 단일 바이트 문자 인코딩이다. iso-8859-1과 일부 호환된다.
MIME / IANA | windows-1252[1] |
---|---|
다른 이름 | cp1252 (코드 페이지 1252) |
만든이 | 마이크로소프트 |
표준 | WHATWG 인코딩 표준 |
분류 | 확장 ASCII, Windows-125x |
상위 인코딩 | ISO 8859-1 (C1 제어 문자 제외) |
변환 / 암호 | ISO 8859-15 |
예 편집
문자인코딩(character encoding) 변환[2]
encode | Windows-1252 | 2021³âµµ °¢Á¾ ½Åû¡¤Á¢¼ö °èȹ °ø°í |
decode | euc-kr | 2021년도 각종 신청·접수 계획 공고 |
호환성 편집
euc-kr환경의 Windows-1252로 작성된 텍스트(text) '하천'을 리눅스 utf-8환경에서 열어보았을 때 'ÇÃõ'로 깨진 문자가 보여진다.
encode | Windows-1252 | ÇÃõ |
decode | utf-8 | ÇÏõ |
디코딩(decoding)후 한번더 디코딩(문자변환)
encode | Windows-1252 | ÇÏõ |
decode | euc-kr | 하천 |
윈도우즈1252 테이블 편집
—0 | —1 | —2 | —3 | —4 | —5 | —6 | —7 | —8 | —9 | —A | —B | —C | —D | —E | —F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 0 | SOH 0001 01 | STX 0002 02 | ETX 0003 03 | EOT 0004 04 | ENQ 0005 05 | ACK 0006 06 | BEL 0007 07 | BS 0008 08 | HT 0009 09 | LF 000A 010 | VT 000B 011 | FF 000C 012 | CR 000D 013 | SO 000E 014 | SI 000F 015 |
1_ 16 | DLE 0010 16 | DC1 0011 17 | DC2 0012 18 | DC3 0013 19 | DC4 0014 20 | NAK 0015 21 | SYN 0016 22 | ETB 0017 23 | CAN 0018 24 | EM 0019 25 | SUB 001A 26 | ESC 001B 27 | FS 001C 28 | GS 001D 29 | RS 001E 30 | US 001F 31 |
2_ 32 | SP 0020 32 | ! 0021 33 | " 0022 34 | # 0023 35 | $ 0024 36 | % 0025 37 | & 0026 38 | ' 0027 39 | ( 0028 40 | ) 0029 41 | * 002A 42 | + 002B 43 | , 002C 44 | - 002D 45 | . 002E 46 | / 002F 47 |
3_ 48 | 0 0030 48 | 1 0031 49 | 2 0032 50 | 3 0033 51 | 4 0034 52 | 5 0035 53 | 6 0036 54 | 7 0037 55 | 8 0038 56 | 9 0039 57 | : 003A 58 | ; 003B 59 | < 003C 60 | = 003D 61 | > 003E 62 | ? 003F 63 |
4_ 64 | @ 0040 64 | A 0041 65 | B 0042 66 | C 0043 67 | D 0044 68 | E 0045 69 | F 0046 70 | G 0047 71 | H 0048 72 | I 0049 73 | J 004A 74 | K 004B 75 | L 004C 76 | M 004D 77 | N 004E 78 | O 004F 79 |
5_ 80 | P 0050 80 | Q 0051 81 | R 0052 82 | S 0053 83 | T 0054 84 | U 0055 85 | V 0056 86 | W 0057 87 | X 0058 88 | Y 0059 89 | Z 005A 90 | [ 005B 91 | \ 005C 92 | ] 005D 93 | ^ 005E 94 | _ 005F 95 |
6_ 96 | ` 0060 96 | a 0061 97 | b 0062 98 | c 0063 99 | d 0064 100 | e 0065 101 | f 0066 102 | g 0067 103 | h 0068 104 | i 0069 105 | j 006A 106 | k 006B 107 | l 006C 108 | m 006D 109 | n 006E 110 | o 006F 111 |
7_ 112 | p 0070 112 | q 0071 113 | r 0072 114 | s 0073 115 | t 0074 116 | u 0075 117 | v 0076 118 | w 0077 119 | x 0078 120 | y 0079 121 | z 007A 122 | { 007B 123 | | 007C 124 | } 007D 125 | ~ 007E 126 | DEL 007F 0127 |
8_ 128 | € 20AC 0128 | ‚ 201A 0130 | ƒ 0192 0131 | „ 201E 0132 | … 2026 0133 | † 2020 0134 | ‡ 2021 0135 | ˆ 02C6 0136 | ‰ 2030 0137 | Š 0160 0138 | ‹ 2039 0139 | Œ 0152 0140 | Ž 017D 0142 | |||
9_ 144 | ‘ 2018 0145 | ’ 2019 0146 | “ 201C 0147 | ” 201D 0148 | • 2022 0149 | – 2013 0150 | — 2014 0151 | ˜ 02DC 0152 | ™ 2122 0153 | š 0161 0154 | › 203A 0155 | œ 0153 0156 | ž 017E 0158 | Ÿ 0178 0159 | ||
A_ 160 | NBSP 00A0 0160 | ¡ 00A1 0161 | ¢ 00A2 0162 | £ 00A3 0163 | ¤ 00A4 0164 | ¥ 00A5 0165 | ¦ 00A6 0166 | § 00A7 0167 | ¨ 00A8 0168 | © 00A9 0169 | ª 00AA 0170 | « 00AB 0171 | ¬ 00AC 0172 | SHY 00AD 0173 | ® 00AE 0174 | ¯ 00AF 0175 |
B_ 176 | ° 00B0 0176 | ± 00B1 0177 | ² 00B2 0178 | ³ 00B3 0179 | ´ 00B4 0180 | µ 00B5 0181 | ¶ 00B6 0182 | · 00B7 0183 | ¸ 00B8 0184 | ¹ 00B9 0185 | º 00BA 0186 | » 00BB 0187 | ¼ 00BC 0188 | ½ 00BD 0189 | ¾ 00BE 0190 | ¿ 00BF 0191 |
C_ 192 | À 00C0 0192 | Á 00C1 0193 | Â 00C2 0194 | Ã 00C3 0195 | Ä 00C4 0196 | Å 00C5 0197 | Æ 00C6 0198 | Ç 00C7 0199 | È 00C8 0200 | É 00C9 0201 | Ê 00CA 0202 | Ë 00CB 0203 | Ì 00CC 0204 | Í 00CD 0205 | Î 00CE 0206 | Ï 00CF 0207 |
D_ 208 | Ð 00D0 0208 | Ñ 00D1 0209 | Ò 00D2 0210 | Ó 00D3 0211 | Ô 00D4 0212 | Õ 00D5 0213 | Ö 00D6 0214 | × 00D7 0215 | Ø 00D8 0216 | Ù 00D9 0217 | Ú 00DA 0218 | Û 00DB 0219 | Ü 00DC 0220 | Ý 00DD 0221 | Þ 00DE 0222 | ß 00DF 0223 |
E_ 224 | à 00E0 0224 | á 00E1 0225 | â 00E2 0226 | ã 00E3 0227 | ä 00E4 0228 | å 00E5 0229 | æ 00E6 0230 | ç 00E7 0231 | è 00E8 0232 | é 00E9 0233 | ê 00EA 0234 | ë 00EB 0235 | ì 00EC 0236 | í 00ED 0237 | î 00EE 0238 | ï 00EF 0239 |
F_ 240 | ð 00F0 0240 | ñ 00F1 0241 | ò 00F2 0242 | ó 00F3 0243 | ô 00F4 0244 | õ 00F5 0245 | ö 00F6 0246 | ÷ 00F7 0247 | ø 00F8 0248 | ù 00F9 0249 | ú 00FA 0250 | û 00FB 0251 | ü 00FC 0252 | ý 00FD 0253 | þ 00FE 0254 | ÿ 00FF 0255 |
문자 숫자 구두점 기호 기타 미정의
같이 보기 편집
각주 편집
- ↑ 《Character Sets》, Internet Assigned Numbers Authority (IANA), 2018년 12월 12일
- ↑ [참고](문자인코딩 Windows-1252과 euc-kr)Encoding from Western European (Windows) (code page 1252, Windows-1252) to Korean (EUC) (code page 51949, euc-kr)
- ↑ “Unicode mappings of Windows-1252 with 'Best Fit'”. Unicode. 2015년 2월 4일에 원본 문서에서 보존된 문서. 2015년 2월 4일에 확인함.
- ↑ 《Code Page CPGID 01252 (pdf)》 (PDF), IBM[깨진 링크(과거 내용 찾기)]
- ↑ 《Code Page CPGID 01252 (txt)》, IBM[깨진 링크(과거 내용 찾기)]
- ↑ 《International Components for Unicode (ICU), ibm-1252_P100-2000.ucm》, 2002년 12월 3일
- ↑ 《International Components for Unicode (ICU), ibm-5348_P100-1997.ucm》, 2002년 12월 3일
- (String Manipulation For Programmers- Windows-1252 > euc-kr 한글변환)http://string-functions.com/encodedecode.aspx Archived 2021년 6월 15일 - 웨이백 머신
- (String Manipulation For Programmers- iso-8859-1 > euc-kr 한글변환)http://string-functions.com/encodedecode.aspx Archived 2021년 6월 15일 - 웨이백 머신