MJay
EUC-KR , Unicode, UTF-8, UTF-8에 대해서 본문
EUC-KR = KS완성형 + ASCII
ASCII 는 1 Byte이다.
Window는 EUC-KR을 쓴다
윈도우에서 txt 파일은 EUC-KR이지만 ppt 파일이나 excel 파일은 unicode로 바뀐다고 한다
Linux는 UTF-8을 쓴다 Unicode라고 생각하자
한글을 초성 19개
중성 21개
종성 27개이다
C/C++ 은 KS완성형이였다
자바부터 Java, Python, Ruby부터 Unicode가 나왔다.
'Cloud Computing > NLP' 카테고리의 다른 글
Word2Vec (0) | 2017.05.16 |
---|---|
웹정보처리응용 2017년 4월 6일 목요일 오후 1:49 (0) | 2017.04.09 |
Applied Natural Language Processing - 3주차 (0) | 2017.03.23 |
웹 정보 처리 응용 (2주차) (0) | 2017.03.15 |
1주차 웹 정보 처리와 응용 (0) | 2017.03.02 |