AngelPlayer`s Diary

기본 개념

음성인식 (ASR) : 발화(사람이 말하는 음성 언어)를 문자로 변환하는 기술

NLU(Natural Language Understanding) : 문장의 의미를 이해하는 기술

 

 

 

빅스비 서비스 아키텍처

빅스비 서비스 아키텍처 순서

클라이언트(사용자 휴대폰)에서 발화 발생 -> 음성 파일을 빅스비 서버 전달 -> ASR모델을 통해 음성을 문자로 변환 -> NLU모델이 어떤 캡슐을 사용할지를 결정, 발화의 의도 및 동작에 필요한 값 분석 -> Plan 단계에서 개발자가 개발한 프로그램 실행 및 외부 API 호출 -> 결과 값을 서버로부터 클라이언트에게 전달

 

 

Plan

결과 값을 얻기 위한 할 일에 대한 순서도, 캡슐을 기반으로 생성됨

 

 

 

캡슐 구조

 

- 모델링

actions 파일 : 동작을 나타냄 

concepts 파일 : 피연산자, 연산 종류 등을 나타냄

vocab 파일 : concepts 파일의 예시 발화 모음

 

- 비즈니스 로직

code 파일 : 실제 동작코드를 구현한 파일

endpoints 파일 : 코드와 모델링한 컨셉 action을 연결

 

- UI/UX

layout, views 파일 : 화면 구성

 

- 트레이닝

training : 언어별로 발화를 학습시킴

 

 

 

공유하기

facebook twitter kakaoTalk kakaostory naver band