표준 캐릭터셋
Java 플랫폼의 구현은 모두 다음의 표준 캐릭터셋를 지원 할 필요가 있습니다. 지원 되고 있는 그 외의 캐릭터셋에 대해서는 구현의 릴리스 노트를 참조하십시오. 그러한 옵션의 캐릭터셋의 동작은 구현 마다 다를 가능성이 있습니다.
캐릭터셋 설명
US-ASCII 7 비트 ASCII (ISO646-US/Unicode 캐릭터셋의 Basic Latin 블록)
ISO-8859-1 ISO Latin Alphabet No. 1 (ISO-LATIN-1)
UTF-8 8 비트 UCS 변환 형식
UTF-16BE 16 비트 UCS 변환 형식, 빅 endian 바이트순서
UTF-16BE 16 비트 UCS 변환 형식, little endian 바이트순서
UTF-16 16 비트 UCS 변환 형식, 옵션의 바이트순서 마크로 식별되는 바이트순서
아래코드는 예제입니다.
class CharSetTest {아래 예는 화면결과 입니다.
static String aa = "a1";
static void testAscii() {
try {
byte[] bytes = aa.getBytes("US-ASCII");
for(int i=0; i < bytes.length; i++) {
System.out.print(bytes[i]);
}
System.out.println("");
}catch(java.io.UnsupportedEncodingException e) {
e.printStackTrace();
}
}
static void testUTF8() {
try {
byte[] bytes = aa.getBytes("UTF-8");
for(int i=0; i < bytes.length; i++) {
System.out.print(bytes[i]);
}
System.out.println("");
}catch(java.io.UnsupportedEncodingException e) {
e.printStackTrace();
}
}
static void testUTF16() {
try {
byte[] bytes = aa.getBytes("UTF-16");
for(int i=0; i < bytes.length; i++) {
System.out.print(bytes[i]);
}
System.out.println("");
}catch(java.io.UnsupportedEncodingException e) {
e.printStackTrace();
}
}
static void testUTF16BE() {
try {
byte[] bytes = aa.getBytes("UTF-16BE");
for(int i=0; i < bytes.length; i++) {
System.out.print(bytes[i]);
}
System.out.println("");
}catch(java.io.UnsupportedEncodingException e) {
e.printStackTrace();
}
}
static void testUTF16LE() {
try {
byte[] bytes = aa.getBytes("UTF-16LE");
for(int i=0; i < bytes.length; i++) {
System.out.print(bytes[i]);
}
System.out.println("");
}catch(java.io.UnsupportedEncodingException e) {
e.printStackTrace();
}
}
public static void main(String[] args) {
System.out.println("--- Ascii ---");
CharSetTest.testAscii();
System.out.println("--- UTF-8 ---");
CharSetTest.testUTF8();
System.out.println("--- UTF-16 ---");
CharSetTest.testUTF16();
System.out.println("--- UTF-16BE ---");
CharSetTest.testUTF16BE();
System.out.println("--- UTF-16LE ---");
CharSetTest.testUTF16LE();
}
}
--- Ascii ---
9749
--- UTF-8 ---
9749
--- UTF-16 ---
-2-1097049
--- UTF-16BE ---
097049
--- UTF-16LE ---
970490
'java' 카테고리의 다른 글
| java.util.Map Iteration (0) | 2008/07/02 |
|---|---|
| deep copy with serialization in java (0) | 2008/07/01 |
| java charset에 대해서.. (1) | 2008/06/19 |
| I/O 퍼포먼스 개선 (0) | 2008/06/17 |
| Object 재사용 (0) | 2008/06/16 |
트랙백 1개 | 댓글 1개
트랙백+댓글 | 트랙백 | 댓글
-
About Trackback
트랙백 기능을 이용하시면 이 밑부분에 당신의 글을 댓글처럼 달아놓으실 수 있습니다. 이 글의 트랙백 주소는 http://www.sjava.net/trackback/62
입니다. -
Trackback from 내 남자의 길~!
이기종의 플랫폼과 연동할 이슈가 발생하면, 네트웍을 통한 Byte Ordering과 더불어 스트링의 인코딩/디코딩도 이슈거리입니다. 아래는 자바 API 5의 java.nio.charset.Charset 에 나오는 내용입니다. 표준 캐릭터셋 Java 플랫폼의 구현은 모두 다음의 표준 캐릭터셋를 지원 할 필요가 있습니다. 지원 되고 있는 그 외의 캐릭터셋에 대해서는 구현의 릴리스 노트를 참조하십시오. 그러한 옵션의 캐릭터셋의 동작은 구현 마다 다를 가능../ 2009/02/18 04:20 / delete
-
Comment by
성군 at 2009/02/18 04:23 / Permalink / Reply / Modify/Delete너무 찾던 자료라 트랙백 걸고 퍼갔습니다.
혹 문제가 있다면 내리도록 하겠습니다. ^^
좋은 자료 감솨합니다. -
Write your comment







이올린에 북마크하기
이올린에 추천하기
















