MJay

EUC-KR , Unicode, UTF-8, UTF-8에 대해서 본문

Cloud Computing/NLP

EUC-KR , Unicode, UTF-8, UTF-8에 대해서

MJSon 2017. 3. 30. 18:57
EUC-KR = KS완성형 + ASCII

ASCII 는 1 Byte이다.

Window는 EUC-KR을 쓴다

윈도우에서 txt 파일은 EUC-KR이지만  ppt 파일이나 excel 파일은 unicode로 바뀐다고 한다

Linux는 UTF-8을 쓴다 Unicode라고 생각하자

한글을 초성 19개

중성 21개

종성 27개이다

C/C++ 은 KS완성형이였다 

자바부터 Java, Python, Ruby부터 Unicode가 나왔다.