AngelPlayer`s Diary

자연어 학습

 

 

Goal : 각 발화에 대한 결과 (action 자체나 output Concept이 Goal이 될 수 있음)

 

 

 

Training

Training : 캡슐 내 해당 언어에 대한 모든 학습데이터

Training Example : 학습 예제 하나 하나를 의미

 

Training Example을 만들 때 Goal과 태깅을 필수적으로 해야 함

 

- 태깅 시 Vocab이 있는 경우 (form에 Vocab의 내용을 작성해줌)

 

 

Training 시 에러가 발생하는 경우

Not Learned : 학습을 진행하였음에도 Not Learned 상태인 경우 태깅이 잘못된 상태를 의미하므로 적절한 태깅으로 수정이 필요함

 

Illegal Plan : Goal의 모델링이 잘못된 경우, 발화 자체가 다른 Goal에 적절한 경우

 

 

 

자연어 학습의 기본 원칙 

빅스비는 대량의 학습 데이터보다는 소량의 정확한 데이터에서 학습이 잘 됨

캡슐 당 최대 트레이닝 개수는 2000개

 

 

Tightly-Scoped : Core Use Cases에 집중하는 기능만을 구현

주요 시나리오에 대한 정확한 기능을 학습하는 것이 더욱 좋음

 

 

Well-Discriminated : 캡슐의 모든 Query가 명확하게 해당 캡슐에 매핑되는 것을 의미

 

 

Obviously-Tagged

 

 

좋은 자연어 학습 방법

 

 

 

공유하기

facebook twitter kakaoTalk kakaostory naver band