입력 : 2017.05.08 03:00

[갤럭시S8의 인공지능 비서 빅스비의 모든 것 문답풀이]

- 스마트폰에 AI 내장?
말한 내용은 클라우드 서버로 전송, 딥 러닝 통해 오류 수정하며 진화… 스마트폰 자체는 학습 기능 없어

- 애플 '시리'보다 우수?
여러 작업 명령 복합적으로 수행… 시리는 단순한 명령 처리 위주

- 작년 인수한 비브랩스 기술?
이르면 올해 말부터 적용 계획… 훨씬 더 정교한 서비스 가능해져

삼성전자가 1일 스마트폰 갤럭시S8의 인공지능(AI) 음성 인식 비서 빅스비(Bixby) 서비스를 선보였다. 서비스 시작 후 지난 6일까지 국내에서 약 37만명이 사용한 것으로 알려졌다. 서비스 첫날에만 16만명이 빅스비를 사용했고 약 250만건의 명령어를 처리했다. 사용자들 사이에서는 "생각보다 말을 잘 알아듣는다" "신기하다"는 평가와 함께 "왜 목소리 구분을 못하느냐"는 식의 지적도 나오고 있다. 빅스비의 작동 원리와 사용자들이 쏟아낸 궁금증을 문답으로 정리했다.

빅스비 작동 원리 개요
Q: 한국어를 어떻게 배우나.

A: 연구원 수백명이 달라붙어서 매일 말을 입력하는 방식으로 가르쳤다. 마치 아이가 부모가 하는 말을 듣고 옹알이를 하며 말을 배우는 것과 비슷한 방식이다. '내가 사과를 먹는다' '사과를 내가 먹는다' '먹는다 사과를 내가'처럼 같은 의미의 문장을 단어 순서를 바꿔 입력한 뒤 모두 같은 뜻으로 인식시키는 방법이다. 따라서 사용자가 늘어날수록 빅데이터가 쌓여 이해할 수 있는 문장도 늘어난다. 지역 사투리는 많이 사용되는 사투리 음성 데이터를 갖고 빅스비를 가르쳤다. 지방 출신 연구원들이 직접 사투리를 써가며 빅스비를 테스트해보기도 했다. 상대적으로 사용 빈도가 적은 사투리는 아직 인식률이 낮지만 개선 작업을 진행 중이다.

Q: 갤럭시S8 스마트폰에 AI(인공지능)가 내장돼 있다는 뜻인가.

A: 스마트폰에 대고 온종일 말을 건다고 내 빅스비만 더 똑똑해지는 것은 아니다. 스마트폰 자체에는 학습 기능이 없다. 사용자가 빅스비에게 말하는 내용은 곧바로 국내에 있는 클라우드(가상 저장 공간) 서버로 전송된다. 빅스비 서버는 모든 사용자가 공유한다. 이곳에서 명령에 대한 분석이 이뤄진다. 전용 서버에는 인공지능이 시행착오를 통해 스스로 학습하는 딥러닝(deep learning) 기술이 적용돼 있다. 사용자들이 빅스비에 말을 걸면 대화 내용과 함께 빅스비가 어떻게 일을 처리했는지도 저장된다. 사용자가 '좋아요'라고 피드백을 누르면 이 처리 과정을 제대로 완수한 것으로 판단하고, '나빠요'라고 누르면 어느 부분에서 문제가 생겼는지를 검토하고 오류를 수정한다.

Q: 빅스비가 애플의 AI 비서 '시리'보다 낫다고 하는 이유는.

A: 빅스비는 현재 3000가지 복합 기능을 처리할 수 있다. 이해할 수 있는 문장은 수백만가지다. 스마트폰 앱(응용 프로그램)과 연동해 사진 촬영, 문자 전송, 전화 걸기, 날씨 정보 검색, 알람 설정 등을 할 수 있다. 현재 빅스비로 작동할 수 있는 앱은 카카오톡 등 30 여 개 정도다. 앞으로 계속 추가될 예정이다. 빅스비의 장점은 여러 작업 명령을 수행할 수 있다는 것이다. 예를 들어 '홍길동에게 이 화면을 캡처해서 메시지 보내줘'라고 말하면 화면 캡처, 연락처 검색, 전송까지 세 가지 기능을 처리한다. 반면 시리는 복합 명령 처리 기능이 떨어진다. '카메라를 켜줘' '문자를 보내줘' 식의 단순 명령을 주로 수행한다. 아마존 알렉사는 스마트폰이 아니라 인공지능 스피커를 기반으로 작동한다. 갤럭시S8에 빅스비와 함께 설치된 구글 음성 인식 서비스는 정보 검색 위주다.

Q: 빅스비에 삼성이 작년 2440억원에 인수한 실리콘밸리 벤처기업 '비브랩스'의 기술이 적용됐나.

A: 현재 빅스비에는 비브랩스 기술이 적용되지 않았다. 한국어 서비스는 수년 전부터 준비한 삼성 자체 기술로 개발됐다. 비브랩스 기술은 이르면 올해 말부터 적용할 계획이다. 이 기술이 적용되면 지금보다 더 서비스가 정교해진다. 예를 들어 '5월 15일 오후 3시에 서울 강남역 인근 H레스토랑에 5명 예약해줘'라고 말하면 H레스토랑 홈페이지 예약 사이트로 들어가 자동으로 이용자 이름과 전화번호, 인원 수를 넣어 예약한 뒤 이 식당까지 찾아가는 방법을 내비게이션이나 지도 앱으로 보여준다.

Q: 빅스비란 무슨 뜻인가?

A:
언어학자, 소설가, 문화 평론가 등이 제시한 아이디어를 놓고 10~30대를 대상으로 설문 조사를 했다. 이들이 가장 많이 선택한 빅스비로 결정했다. 특별한 뜻은 없다. 전 세계인 누구나 발음하기 쉬운 이름이다.

Q: 빅스비에게 음성 명령을 내릴 때 사용자가 아닌 주변 사람의 말까지 함께 인식하는 경우를 종종 볼 수 있다. 아직은 목소리 구분을 못하나.

A: 설치할 때 "빅스비"를 3번 외치는 것은 "빅스비"라는 소리에 반응할 수 있도록 하기 위한 것이다. 아직 초기 단계여서 사용자와 주변 사람의 목소리를 구분하는 기능은 없다. 사용자의 목소리만 구분해 인식하는 기능은 추후 업데이트할 예정이다. 지금으로서는 주변에 소음이 많은 곳이라면 빅스비 설정으로 들어가서 '빅스비 음성 호출'을 '사용 안 함'으로 설정하는 게 좋다.

조선일보 조선닷컴

시니어