MJay
POS Tagging 정리 본문
- POS Taggin
- lexical token
- Token
- 어휘가 있는 token
- POS란
- 품사라고 뜻한다
- noun, adverbs, adjectives, pronouns, conjunction
- Part of Speech
- Tagging과 같은 뜻
- tagging, labeling, annotation
- POS Tag
- Brown Corpus
- 문장 많이 모아 놓은것
- Penn Treebank
- 가장 많이 쓰인다
- 45 Pos Tagging
- Claws5 “C5"
- taggin 종류
- 의미 tagging
- Pos tagging
- 구문 tagging
- 개체명 tagging
- P, L, O
- POS Tagsets
- Verbs
- VB,VBP,VBZ,VBD
- Nouns
- NNP,NNPS,NN,NNS
- POS Tagging Approaches
- Rule-Based
- 규칙기반
- 사람이 규칙을 준다
- Learning-Based
- Machine Learning
- Classification Learning
- Labeling as Classification
- Sequecen Laelign s Classification
- Forward
- Forward & Backward
- 하나의 단어중심으로 왼쪽이랑 오른쪽을 본다
- HMM
- 좌문맥만 본다
- CRF
- 우문맥만 본다
- Typical machine learnign address the problem
- Statistical models
- better than Rule-Based
- hmm
- hmm model
- automata 형식
- output observation probability
- wikipedia 보면서 공부해보기
- 시스템이 은닉된 상태와 관찰가능한 결과의 두 가지 요소로 이루어졌다고 보는 모델
- 은닉 마르코프 모델은 시간의 흐름에 따라 변화하는 시스템의 패턴을 인식하는 작업에 유용하다.
- Entropy
An entropy maximization problem is a convex optimization problem of the form
- maximize
- subject to
where is the optimization variable, and are problem parameters, and denotes a vector whose components are all 1.
'Cloud Computing > NLP' 카테고리의 다른 글
웹 정보 처리응용 정리해보기 (0) | 2017.06.19 |
---|---|
웹 정보 처리응용 정리해보기 (0) | 2017.06.07 |
Word2Vec (0) | 2017.05.16 |
웹정보처리응용 2017년 4월 6일 목요일 오후 1:49 (0) | 2017.04.09 |
EUC-KR , Unicode, UTF-8, UTF-8에 대해서 (0) | 2017.03.30 |