top of page
  • 한국인사이트연구소 김덕진 부소장

음성 인식 인공지능, 주목해야 할 기회는?


* KBS1 라디오 <경제투데이>의 '궁금한 IT 트렌드' 코너에 출현한 내용입니다.

* 본 내용은 2016년 9월 26일 방송분입니다.

영화에서처럼 인간과 기계가 대화하는 것이 이제 현실이 되고 있습니다. 글로벌업체들이 음성 인식 인공지능을 둘러싼 시장 경쟁을 하고 있는데요. 오늘은 음성 인식 인공지능에 대해 알아보겠습니다.

 

원석현 아나운서

음성 인식 인공지능, 요즘 스마트폰은 물론, 생활가전 제품 등에서 흔히 접하는 것을 말하는 건가요?

김덕진 부소장

과거에는 전화만 대신 걸어주는 것으로 신기해하던 음성인식기술이 최근에는 인공지능 기술과 결합되면서 다양한 방법으로 진화하고 있는데요 스마트폰에서부터 홈 IoT 의 핵심기술로까지 발전하고 있습니다. 과거 신문기사를 검색해보면, 재미있는 사실을 발견할 수 있는데요. 음성인식이라는 키워드는 이미 1980년대부터 등장하고 있었을 뿐만 아니라, 당시에도 음성인식 기술이 마치 곧 상용화 될 것 같은 인상을 주고 있었다는 점입니다. 예를 들어, '음성인식 시스템 실용화 활발 (1986년, 매일경제)', '음성인식 컴퓨터" 곧 실용화 (1992년, 동아일보)', '음성인식 PC 시판 (1993년, 경향신문)' 등을 볼 수 있었습니다. 이러한 음성인식 기술의 발전을 일반인들이 처음 제품으로 인식한 것은 20년 전쯤 되는 것 같습니다. 통신사업자 중에서는 1997년 SKT가 음성인식 부가서비스를 제공하기 시작했고, 휴대폰 제조업자 중에서도 1997년 대우통신, 1998년 현대전자가 음성인식이 가능한 기기를 개발했습니다. 물론 당시의 음성인식 기술은 이미 저장된 음성대로 다시 발음하면 그 음성을 인식하고, 거기에 따라 전화가 걸리는 수준이었죠.

현재의 음성인식인공지능 기술은 음성인식기술의 발전과 인공지능의 발전 두가지로 나눠서 생각해볼 수 있습니다. 첫 번째는 음성인식 과 인공지능,두 번째는 음성인식인데, 여기에 두가지 단계 (과거에 우리집 같은 것은 기존 내 목소리를 녹음해서 그것과 같은 패턴을 그냥 기억하는 방식이었는데, 최근에는 음성자체를 글자로 인식하는 기술)가 있습니다. 1) 음성을 글자로 인식하는 기술 - 음성을 컴퓨터가 분석하여 문자데이터로 처리하는 기술

2) 음성 톤과 볼륨 소리등을 체크하는 기술- 전달된 데이터가 인공지능을 통해 분석되어 되돌아오는 기술입니다.

출처 : bluesoccer.net
 

원석현 아나운서

애플, 아마존, 구글, 삼성전자 등 글로벌 IT 기업들이 모두 이 기술 경쟁에 뛰어들었다구요?

김덕진 부소장

일반인들에게 가장 잘 알려진 음성인식 기능의 대표주자는 개인비서 서비스로 알려진 애플의 '시리', 그리고 구글의 '구글나우' MS의 '코타나' 아마존의 알렉사 정도입니다. 특히 '시리'와 '구글나우'는 스마트폰에 탑재되어 이미 많은 사람이 한 번 이상은 경험해 보았고, '코타나'도 윈도우 기반의 컴퓨터를 쓰는 사람들은 누구나 가지고 있습니다. 이처럼 최근에는 음성인식 기술과 인공지능과의 교집합의 분야에 집중적인 투자가 이루어지고 있습니다.

최근에는 스마트폰이나 PC기반이 아닌 일종의 음성인식 컨트롤러, 음성인식전문기기 가 따로 나오고 있는데요.

대표적 아마존 에코 Amazon Echo, (2년전발표, 300만대 판매), SKT도 얼마전 '누구'라는 음성인식 기기를 발표하였고요. 구글 홈도 출시 예정 발표(음성비서스피커) (2016년 5월/올가을 나올예정)를 했습니다. 애플도 SIRI기반 스피커 개발중이라는 소식이 들려오면서 대부분의 글로벌 IT기업들이 이 기술 대열에 참여하고 있습니다. 한국에서도 삼성전자·네이버 등이 음성 인식 서비스를 개발 중이고요. 네이버는 음성으로 검색하고, 검색 결과를 대화형으로 제공하는 '라이브 대화'를 개발 중입니다. 삼성전자는 'S보이스'라는 음성 인식 서비스를 스마트폰에서 제공하고 있지만 애플·구글에 비해 인식률이 좋지 않다는 게 업계의 일반적인 평가입니다.

 

원석현 아나운서

음성 인식 인공지능 기술 개발에 적극적으로 나서는 이유가 뭡니까?

김덕진 부소장

인공지능 시장의 관문으로 음성인식시장이 주목받고 있기 때문이고요. 음성인식 스마트폰의 핵심기능으로 부상했기 때문입니다. 모든 앱을 구동시킬수 있는 핵심키로 다른 회사 앱이 아닌 자회사 앱을 구동시키게 할 수 있습니다. 앞으로, 음성 인식 서비스 장악하면 모든 스마트폰앱 좌지우지할 수도 있으며, 스마트폰 뿐만 아니라 모든 가전기기를 컨트롤하고 거기서 새로운 데이터를 학습할 수 있는 게이트웨이의 역할이 가능해질 것입니다. 음성 인식 기술이 사용자의 음성 명령에 따라 열리는 앱을 스스로 결정할 수 있다는 것도 글로벌 IT 기업들이 각축을 벌이는 이유입니다. 쉽게 말해 음성 인식 서비스를 장악하면 모든 스마트폰 앱을 좌지우지할 수 있다는 것이죠. 예컨대 "시청까지 가는 길을 알려줘"라고 구글 나우에 지시하면 네이버·카카오의 지도 앱을 여는 게 아니라 구글의 검색 결과를 보여줍니다. 네이버의 김정희 딥러닝 프로젝트 리더는 "음성은 인공지능이 발전함에 따라 중요한 입력 수단으로 활용될 수 있다"며 "이를 장악하기 위해 각 기업의 기술 개발 경쟁이 치열한 상황"이라고 말했습니다.

 

원석현 아나운서

기계와 어디까지 대화가 가능하고, 얼마나 활용될까요?

김덕진 부소장

다양한 학습을 통해 “대화형”으로 거듭나고 있습니다. 지금은 “검색” 이나 “명령”을 받아들이는 것이 대부분인데 진정한 대화형으로 거듭나기 위해 노력하고 있습니다. 또, 주변환경과 상황을 파악하여 먼저 제안하고 실행하기도 하고요. 가정 뿐만 아니라 온라인쇼핑몰 / 사물인터넷/ 자율주행차까지 연동됩니다.

아마존은 이미 포드와 협력하여 알렉사의 음성인식 서비스를 포드에서 활용하고 있습니다. 운전 도중에 "알렉사, 집에 에어컨 좀 켜줘"라고 말하면 집 안에 설치된 스피커형 기기인 '에코'로 명령이 전달되고, 에코에 연동된 에어컨이 자동으로 켜지는 식입니다. 애플의 시리는 지난 6월 13일(현지 시각) 미국 샌프란시스코에서 열린 개발자 대회의 주인공이었는데요. 애플의 크레이그 페더리기 수석 부사장이 기조 연설 무대에 올라 "시리, 우버를 불러줘"라고 아이폰에 말하자, 차량 공유 서비스 우버 앱(응용 프로그램)이 자동으로 열렸습니다. 화면을 터치하지 않고 음성으로만 행사장에 차를 부르는 모습을 시연했습니다. 애플 측은 시리가 등장한 뒤 5년간 축적한 아이폰 사용자들의 음성 데이터를 바탕으로 질문에 답하는 속도나 정확성을 세계 최고 수준으로 끌어 올렸다고 자신했습니다.

출처 : 연합뉴스
 

원석현 아나운서

이에 따라 어떤 기회들에 주목해야할까요?

김덕진 부소장

기술의 발전과 함께 개발자들은 인공지능 api를 활용하여 다양한 산업을 만들어 낼 수 있습니다. 음성인식기술 자체를 내가 개발하지 않더라도 구글이나 네이버 등에서 음성을 인식해서 텍스트로 변환해주는 기술들은 이미 다양한 앱이나 프로그램에 연동할 수 있도록 API 로 만들어둡니다. 이를 활용한 다양한 기술이나 서비스 연동등에 대한 것들도 봐야하며, 이러한 핵심기술을 가지고 있는 곳들은 계속적으로 자사의 기기들과 연계가능한 “서드파티”앱이나 제품을 찾고 있습니다.

향후 교육시장에서도 대화형 인공지능이 활용가능한데, 국내 업체인 아카스터디가 개발한 '뮤지오(Musio)'는 인공지능 엔진 '뮤즈(Muse)'를 통해 기존의 대화 내용을 반영한 새로운 커뮤니케이션을 시도하고 있습니다. 특히 영어 교육에 특화된 기능을 제공할 계획이라고 합니다.

현재 국내 이동통신사·금융사 등 다수의 기업이 마인즈랩의 시스템을 콜센터에 적용하고 있는데요. 그러던 중 최근엔 미국에서도 첫 사업을 수주해서 9월말부터 영어 상담센터 콜 분석 서비스를 시작합니다. 영어가 기본인 글로벌 음성인식 및 빅데이터 업체와의 경쟁에서 당당히 이겨서 사업을 따내며 첫 레퍼런스를 발판으로 본격적인 북미진출을 준비하고 있습니다. 예컨대 고객이 전화로 개인 서비스에 대해 물으면 이 문장이 콜센터 관리자의 화면에 뜨면서 동시에 핵심 키워드로 ‘포인트 확인’이 나타나는 식인거죠. 상담센터 관리자가 수많은 통화를 일일이 다시 들어보지 않아도 상담 내용과 고객의 요구사항을 실시간으로 파악할 수 있답니다.

조회수 128회댓글 0개
bottom of page