R-POINT

제4차 산업혁명의 격전지 ‘인공지능 음성비서’

글 _ 공병훈(협성대 미디어영상광고학과 교수) / 일러스트 _ 이혜헌

 

 많은 전문가들이 한 목소리로 말한다. “제4차 산업혁명 전쟁은 이미 시작됐다.” 각자의 영역을 구축해온 구글과 페이스북, 마이크로소프트, 아마존과 같은 글로벌 기업은 물론 삼성전자와 LG전자, 네이버 등 국내 기업들이 앞다투어 4차 산업혁명 기술 개발에 뛰어든 것만 봐도 알 수 있다. 그리고 현재까지 이 전쟁의 최고 격전지는 단연코 인공지능 음성비서 서비스다.
 


인공지능 음성비서의 포문을 연 ‘아마존 알렉사’

개인 일정을 알려주며 알람을 울린다. 뉴스와 교통, 날씨 등을 검색해 알려준다. 중요한 메일을 표시하고 읽어주며 스팸을 삭제한다. 음악과 영화, 전자책을 추천하고 재생한다. 인공지능 음성비서 ‘아마존 에코’에 관한 얘기다. 아마존 에코는 인공지능 비서 서비스인 알렉사(Alexa)를 탑재해 사용자의 음성에 답하도록 한 디바이스다.
인공지능 음성비서 서비스는 사용자의 음성을 통해 상호작용하며 개인 비서 역할을 한다. 회사에서는 업무를 더욱 빠르고 정확하게 처리하고, 가정에서는 사물인터넷 디바이스들을 언제 어디에서나 조절한다. 이 모든 것은 구체적인 기능을 지원하는 애플리케이션(이하 ‘앱’) ‘아마존 스킬(Amazon Skill)’이 있기에 가능하다. 아마존 스킬은 개발자들과 기업들이 앱을 추가하고 사용자들이 다운로드하며 점차 확대되고 있다. 2018년 9월 기준, 180 개국에서 5만 개 이상의 스킬을 제공하며, 알렉사가 지원할 수 있는 디바이스는 2만 개 이상이다. 



▲ 아마존 에코



〈아마존 인기 스킬 List〉

· 비트 더 인트로(Beat the Intro): 노래 이름과 작곡가와 가수를 맞추는 게임
· 헤드 업(Heads Up): 단서들을 통해 단어를 알아 맞추는 게임
· 내셔널 지오그래픽 퀴즈(National Geographic Quiz): 잡지 내용에 기반한 게임
· 오늘의 퀴즈(Question of the Day): 예술, 오락 등 다양한 분야를 아우르는 퀴즈
· 스카이림(Skyrim)과 마법의 문(The Magic Door): 음성 기반 어드벤처 게임
· 트리비아 히어로(Trivia Hero): 최대 20명까지 퀴즈로 지식을 경쟁
· 세계 수학 리그(World Mathematics League): 매일 수학 문제풀이를 집단으로 경쟁

 

아마존 알렉사는 인공지능 음성비서 기술의 포문을 열었다고 할 수 있다. 그리고 아마존 스킬 플랫폼을 통해 네트워크 효과가 작동되는 비즈니스 생태계를 성공시켰다고 평가 받는다. 또한 아마존의 CEO인 제프 베조스(Jeff Bezos)는 아마존 에코를 아마존 웹 서비스, 아마존 마켓 플레이스, 아마존 프라임 멤버와 함께 비즈니스의 4대 기둥으로 소개한 바 있다.

 

 

인공지능 음성비서; 사용자의 음성을 통해 상호작용하며 개인 비서 역할을 하는 인공지능 서비스 


 

사람과 말로 대화하는 스마트 디바이스

컴퓨터 기술이 발전하면서 사람들은 컴퓨터와 상호작용하는 다양한 방법을 발달시켜 왔다. 버튼, 키보드, 스위치, 마우스, 펜마우스, 터치스크린 등이다. 음성 기호인 말을 이용하는 것은 인간과 컴퓨터의 상호작용에 있어 가장 이상적인 인터페이스다. 말은 사람과 사람의 가장 태생적이며 본능적인 커뮤니케이션 도구이기 때문이다.
음성인식 기술은 음향학적 신호(acoustic speech signal)를 단어나 문장으로 변환한다. 보다 자세히 설명하면, 아날로그 소리에서 음향 신호를 추출한 후 잡음을 제거해 디지털 데이터(data)로 변환하고, 이 디지털 데이터의 특징과 패턴을 추출해 서버 컴퓨터에 있는 음성모델 데이터베이스(DB)와 비교한 후 어떤 의미인지를 파악하는 원리다.
음성인식 기술이 본격적으로 개발되고 상용화된 계기는 2010년 이후 스마트폰의 확산이다. 스마트폰은 빅 데이터(big data)를 처리할 수 있는 프로세서를 지니고 있을 뿐 아니라 음성을 인식할 수 있는 마이크와 스피커를 탑재하고 있다. 또 다양한 사물인터넷 관련 칩(chip)과 센서들을 지니고 있어서 음성인식 기술을 적용하기에 최적화된 장치다. 음성인식 기술의 진화는 아직도 진행 중이다. 단순한 명령 정도만 알아듣는 수준을 넘어, 사용자의 말투와 억양을 학습하고 음성 명령들의 패턴과 취향을 학습하는 수준으로 나아가고 있다.
음성인식 기술은 인공지능 기술과 사물인터넷의 본격적인 확산과 맞물려 다양한 분야로 확대될 전망이다. 음성인식을 전면에 내세운 인공지능 스피커가 등장했으며, 다양한 스마트 가전 기기에 음성인식 기능이 적용되고 있다. 나아가 이제는 가전뿐만 아니라 음성인식이 적용된 스마트 차량도 곧 상용화되어 출시될 예정이다. 또한 인공지능 병원, 인공지능 마트, 스마트 농장, 인공지능 교사 등 다양한 산업과 일상에서 활용될 전망이다.


국내외 기업들의 인공지능 음성비서 서비스

2011년 10월 애플은 아이폰4와 함께 시리(Siri)를 선보였다. 시리는 자연어 처리 음성인식 개인비서 프로그램이다. 질문에 답변하고 “사랑해”라고 말하면 “부끄러워”라고 말할 정도의 간단한 대화가 가능하다. 한국어 서비스는 2012년 6월 애플의 모바일 운영체계인 iOS6부터 가능해졌다.?
구글은 2012년 7월 구글 나우(Google Now) 인공지능 음성비서 서비스를 시작했다. 구글 나우는 지메일(Gmail) 계정, 위치와 검색 히스토리 등을 기반으로 사용자가 수행하는 반복 동작을 인지한 다음, ‘카드’ 형태로 관련 정보를 제공한다. 한국에서는 2014년 7월부터 ‘오케이 구글(Okay google)’이란 이름으로 상용화됐다. 이 외에 마이크로소프트는 코타나(Cortana) 같은 음성인식 기반의 개인비서 서비스를 출시했으며, 일본의 NTT도코모는 샤베테콘쉐루(しゃべってコンシェル)라는 외국어 통역 서비스를 출시하기도 했다.
국내에서도 인공지능 음성비서에 대한 관심이 나날이 증가하고 있다. 삼성전자는 2019년부터 스마트TV에 구글의 인공지능 음성 서비스인 구글 어시스턴트를 연동시킬 예정이다. 2월에 공개한 스마트폰 갤럭시S10에 인공지능 반도체(NPU)를 탑재해 음성인식 서비스의 정확도와 속도를 높였으며, 이미지 인식과 자율주행 기술을 구현해내 이목을 집중시켰다.
 


LG전자의 인공지능 플랫폼인 LG 씽큐는 인공지능이 주변환경과 고객을
스스로 학습하고 최적의 방식으로 동작하는 특징을 지닌다. 

 
LG전자가 지난 1월 출시한 휘센 싱큐 에어컨은 교감형 인공지능 기술로 인공지능이 주변 환경과 고객을 스스로 학습해 최적의 환경을 만들어준다. 사람이 주로 머무는 공간은 물론이고 실내 · 외 온도, 습도, 공기 질 등 생활 환경과 고객의 사용패턴까지 학습해 적절한 코스로 작동한다. 사용자가 묻지 않아도 상황에 따라 운전모드를 변경하고 음성으로 알려준다.
네이버는 2017년 5월 인공지능 플랫폼 ‘클로바(Clova)’를 공개했다. 그해 10월엔 귀여운 디자인과 가벼운 무게로 간편하게 휴대할 수도 있는 음성인식 인공지능 스피커 ‘프렌즈’를 출시했다. 고객은 프렌즈를 통해 음악부터 일정 관리, 메모, 알람 등 다양한 서비스를 이용할 수 있다. 2019년 네이버는 클로바 앱과 클로바가 탑재된 스피커를 통해 스마트 홈 디바이스들을 관리하는 기능을 개발해 선보일 예정이다.

 

2019-03-01

WORK > JUMP UP 카테고리의 다른 글 보기

    최상단으로 가기