목록Cloud Computing (132)
MJay
EUC-KR = KS완성형 + ASCII ASCII 는 1 Byte이다. Window는 EUC-KR을 쓴다 윈도우에서 txt 파일은 EUC-KR이지만 ppt 파일이나 excel 파일은 unicode로 바뀐다고 한다 Linux는 UTF-8을 쓴다 Unicode라고 생각하자 한글을 초성 19개 중성 21개 종성 27개이다 C/C++ 은 KS완성형이였다 자바부터 Java, Python, Ruby부터 Unicode가 나왔다.
세미나를 위해 TR-Spark 논문을 읽어보고 ppt로 만들어봤다. 많이 배울수있었다. 나중에 TR-Spark를 실제로 쓸 날일 올꺼같다. https://drive.google.com/open?id=0B93gDq1ZuFfud2hBcVM2TVFpSkU
Applied Natural Language Processing Feature Selection TI.IDF Term weighting Term Normalization에 대해서 알아보자 Text를 Categorize할때 신경써야 할 부분이 있다. 일단 언어적인 표현이다. Words 도 대문자가 있고 소문자가 있기 때문에 신경써줘야하고 또한 복수 texts 같은 건 text로 바꾸면 된다. Word-level n-grams 은 뭘까 간단하게 말해서 입력한 문자열을 N개의 기준 단위로 절단하는 방법이다. 나누는 기준은 한 글자가 될수 있고 단어가 될 수 있다. 이 외등등 구두법도 따져야한다. beside there are another things to consider. non-linguistic feat..
AI Basics - Knowledge, Knowledge Representation이다. 그리고 그 Knowledge 으로 Inference하는게 목적이다. AI System이라고 말할 수 있는 건 Knowledge Base에 Inference Engine이 들어가는 것 들이다. Knwoeldge Represenation이란 data structure (자료구조) + interpretive procedure(추론적 과정) 이다 결국 Knowledge를 통해 추론하는 것이다. Knowledge-Base이란 세상에 대한 표현이다. Inference engine은 이 Knowledge Base와 input으로부터 새로운 문장을 도출하는 과정이다. Knowledge를 표현할때 쓰이는 구성요소는 Syntax(g..
몰랐떤 사실인데 서버에 image를 저장할 때 쓰이는 경로는 var/www/html이다. 이렇게 var/www/html에 그림을 저장을 하면 여기에 그림을 저장해서 빼올수있다. 유용하게 쓰일꺼같다. [function.jpeg (1222×706)](http://bd-1.cs.kookmin.ac.kr/jc/function.jpeg) http://bd-1.cs.kookmin.ac.kr/jc/function.jpeg function.jpeg (1222×706) function.jpeg (1222×706)
먼저 Breadth First Search에 대해서 알아보자. First Out First In 핵심은 Open List에 있는 젤 왼쪽꺼를 remove하고 remove한 children을 젤 오른쪽에 있다. 예로 들면 A를 remove 하면 A의 children인 D,E,G가 OpenList에 써진다. 혹시나 ChildRen이 겹치면 G G’ G’’ 이렇게 써진다 BFS 는 모든 연산자가 같은 cost일때 optimal하다. Time/Space complexity — size of tree 이다. Tree의 깊이 이다. 이고 d는 Tree의 깊이다. b는 leaf node이다. 그래서 Breadth First Search는 얇은 문제에 좋다. 8-puzzle 에 BFS를 도입하면 이런 flow가 생긴다..
AI, Machine Learning, Deep Learning에 대해서 알아보자 AI 는 지식표현, game therory, NLP, Q&A 등등이 들어있따 Machine Learning은 알고리즘이고 Deep Learning은 이렇게 3가지가 유명하다 AI는 대표적인 예는 NLP로 성공한 Apple의 시리이다 Deep Learning의 대표적인 예는 AlphaGo 요즘은 인간보다 로봇이 글을 더 잘 쓴다고 한다. 날씨도 로봇이 더 잘한다고 한다. python으로도 이렇게 nlp을 지원해주는 tool이 있다.
Alpha-Beta Search에 대해서 알아보자 .인공지능에서 쓰는 기법이다. 문제를 해결하기 위해 Search하는 것이다. Puzzle 알 맞추기 A -> B로 제일 최단 경로를 알아보기 , Chess를 해보기, John이 Mary의 조상이라고 증명해보기 이런 것들이 다 Search하는 기법이다. 과정들이 있다. 먼저 해야할 것은 문제가 정확히 무엇인지 아는 것이다. 초기의 상태가 무엇이고 궁극적인 상태는 무엇인지 알아야하는 것이다. 그리고 문제를 분석하고 풀어야 할 task를 나타내야 한다 여기서 쓰이는게 자료 구조이다. 그리고 search methods를 적용하는 것이다 Problems의 종류는 State Space Representation , AND /OR graph, Problem-reduc..
처음으로 Artificial Intelligence를 듣는 날이였다. 우종우 교수님은 영어를 매우 잘하신다. 이정표이다. Artificial 인공적이라는 뜻이고 Intelligence는 무슨 뜻일까 . 지능이다. 지능은 4가지가 있다. UnderStanding= 오감을 통해 인식하고 , 언어를 이해하는 것이다. Reasoning: 추측이라고 보면 된다. Learning - 지식을 배운다고 보면 된다. Creating, Adaptiveness 등등 있다. A.I의 기본 개념에 대해서 알아보자 A.I는 컴퓨터한테 사람들이 생각하고 행동하는 것처럼 하게 만들게 공부하는 분야이다 사람의 지적 행동을 컴퓨터가 모방할수 있도록 하는 과학/공학 분야이다. A.I의 분야는 엄청 다양하다. Symbolic program..
처음에는 Artifical Intelligence and Machine Learning AI란 사람의 지적 행동을 컴퓨터가 모방할 수 있도록 하는 과학 분야이다. Turing Test에서 시작했다. A는 컴퓨터이고 B는 휴먼이다 A.I. 가 할수 있는것들은 이렇게 다양합니다. 이런 기능도 다 AI에서 비롯된 것입니다. 관련된 이슈로는 Rank Learning Algorithms -> Seamlessly integrating into RDBMS(관계형데이터베이스가)있다. 유명한 Netflix도 recommendation을 쓰는데 AI에서 나왔다고 하면 된다.Approaches to AI 1. Knowledge-based Approach - Data are already formalized.2. Data D..