반복영역 바로가기
주메뉴로 바로가기
본문으로 바로가기

유망기술찾기

유망기술검색

유망기술찾기 유망기술검색

중소기업 기술로드맵 조회결과

로드맵 분류표 보기    
음석인식 SW
* 발행 년도 : 2017년
1. 기술로드맵

음석인식 SW 기술로드맵

2. 개요
가. 정의 및 범위
  • 정의 : 음성인식 SW란 외부에서 발생된 음성을 텍스트와 같은 정보로 변환하고 변환된 정보를 이해하며, 반대로 정보를 합성음성으로 변환해주는 등 일련의 기술을 통해 제품이 사용자의 요구에 따라 적합한 서비스를 제공하고, 응용분야에서 서비스 목적에 부합할 수 있도록 하는 시스템 소프트웨어나 응용 프로그램
  • 범위 : 음성인식 SW의 음성인식모듈에서는 사용자의 발화를 기계가 이해할 수 있는 텍스트로 변환한 후, 언어 이해 모듈에서 의미 분석을 통하여 사용자의 의도를 이해하게 되고, 대화 관리 모듈에서는 사용자의 의도 및 상황정보를 기반으로 사용자가 요청한 태스크에 필요한 추가적인 정보를 사용자와의 대화를 통하여 요청하게 됨. 사용자가 요청한 태스크는 태스크 에이전트로 전달되어 수행하게 되며, 수행 결과는 사용자에게 전달하기 위해서 발화 생성부 및 음성 합성 과정을 통하여 자연스러운 음성으로 사용자에게 전달
나. 주요 제품

[ 제품분류 관점 기술범위 ]

제품분류 관점 기술범위
기술개발
테마
제품분류 관점세부기술
음성인식
SW
음성인식
기술
음성인식
기술
  • 음성전처리, 음성분석, 음향모델링, 탐색기술, 음성이해, 음성분석, 음향모델, 패턴매칭, 대화체 음성인식, 대어휘 연속어 인식, 고속 탐색기술, 언어모델링, 다국어 음성인식 등
음성합성
기술
  • 문서 전처리기술, 문자, 발음 변환기술, 운율제어기술, 음색변환기술 등
화자인식
기술
  • 화자식별기술, 화자 검증기술 등
언어처리
기술
언어분석
기술
  • 형태소 분석기술, 구문분석 기술, 의미해석 기술 등
대화처리
기술
  • 대화 모델링 기술, 대화이해 기술, 대화생성 기술 등
자동번역
기술
  • 입력문에 대한 형태소 분석과 구문적 변환, 통계적 자동번역, 딥러닝 기술 등
언어 및 음성 인터페이스 기술 임베디드 기반
음성인식 기술
  • 임베디드기반 소어휘 내장형 음성인식 엔진 기반 음성인식 기술 ex) ai스피커, 자율주행자동차
클라우드 기반
음성인식 기술
  • 클라우드 기반 대어휘 내장형 음성인식 엔진 기반 음성인식 기술 ex) 모바일폰, 웹검색
대화형 질의응답
시스템 기술
  • 사용자 의도를 이해하여 복잡한 의도를 가진 정보검색을 할 수 있는 기술, ex) 실시간 고객 응답시스텝
음성기반 제어 및
검색기술
  • 입력된 음성 명령을 통해 디바이스를 제어하거나 지능형 서비스를 제공하도록 함 ex) 스마트홈, 로봇

[ 공급망 관점 기술범위 ]

주요제품 분류표
기술개발
테마
공급망 관점세부기술
음성인식
SW
자원 저장 기술
  • 언어모델을 위한 사전, 문법, 말뭉치 등 대규모 텍스트데이터
  • 음향모델을 위한 다양한 환경에서 발성한 대규모 음성데이터
  • 잡음처리, 음성합성을 위한 빅데이터
개발 음성인식
기술
  • 음성 전처리 기술, 특징추출 및 음성 인식기술, 화자식별기술, 화자검증 기술, 음성인식기반 상황인지기술
언어처리
기술
  • 언어분석기술, 대화처리기술, 자동언어번역기술 등
언어 및 음성
인터페이스
기술
  • 임베디드 기반 음성인식 기술, 클라우드 기반 음성인식 기술, 대화형 질의응답 음성인식 기술, 음성기반 제어 및 검색 기술 등
응용HW/SW 기술
  • 스마트카, 사물인터넷제품(IoT), 인터넷서비스, 개인비서시스템
3. 시장현황 및 전망분석
가. 시장현황 및 전망

(1) 세계시장

  • 음성인식 기술이 응용되는 대표적인 시장으로는 크게 Enterprise시장(Health care, Telematics, Call Center, Smart Homes, Assistive Technology 등의 제품) Telecommunication시장(Google Voice 등의 보이스 다이얼 제품 및 음성명령 제품), Voice Portal시장(Google Voice Search, Nuance Search 등의 음성 검색 제품) 존재. 시장규모는 Enterprise시장이 압도적으로 높으나, 제품군으로는 Telematics, Smart Homes, Telecommunication, Voice Portal 제품과 같이 직접재가 가장 높음. 음성인식 시장 현황

[ 음성인식 SW의 세계 시장규모 및 전망 ]

(단위 : 백만 달러, %)

음성인식 SW의 세계 시장규모 및 전망
구분'16'17'18'19'20'21CAGR
세계시장 97,400 113,200 127,684 147,542 170,489 198,279 16.3

자료: Global virtualization Security Management Solutions (2010-2014. Technavio), SW산업 연간보고서(2014), 음 성인식 시장보고서 등의 자료를 참고하여 전망치 추정

[ 해외 주요 IT기업의 음성제어 스타트업 제어실적 ]

해외 주요 IT기업의 음성제어 스타트업 제어실적
기업명내용
Apple
  • 2010 ‘Siri’ (음성인식 소프트웨어) 인수
  • 2016년 VocalIQ(음성 인터페이스)인수
Amazon
  • 2011 ‘Yap’ (STT: Speech-to-Text)
  • 2014년 ‘Evi’ (지식기반 Semantic Search Engine) ‘INOVA’ (TTS: Text-to-Speech)
Facebook
  • 2013년 ‘Jibbigo’(모바일 다국어 음성번역)
  • 2015년 ‘Wit.at’(음성인식), Two Big Ears(VR오디오) 인수
Google
  • 2014년 ‘DeepMind Technologies’(AI 머신러닝)
  • 2016년 API.AI(음성익식, 자연어 처리)
  • Limes Audio(음성처리 소프트웨어) 인수

* 출처 : 삼성경제 연구소

(1) 국내시장

  • 국내 음성인식 SW의 시장의 경우 `16년 6,967억 원에서 연평균 9.8%의 성장으로 `21년 9,925억 원 규모에 달할 전망

[ 음성인식 SW의 국내 시장규모 및 전망 ]

(단위 : 억 원, %)

음성인식 SW의 국내 시장규모 및 전망
구분'16'17'18'19'20'21CAGR
국내시장 6,967 7,737 8,593 8,813 9,039 9,925 9.8

* 자료: Global virtualization Security Management Solutions (2010-2014. Technavio), SW산업 연간보고서(2014), 음 성인식 시장보고서 등의 자료를 참고하여 전망치 추정

국내 스마트홈 시장 규모 추이
4.기술분석
가. 기술동향 분석

(1) 해외업체동향

  • 2014년 5월에 마이크로소프트가 무료 인터넷 화상전화 서비스인 Skype의 통화를 동시통역하여 제공하는 Skype Translator를 발표, CEO인 SatyaNadella는 음성인식, 자동번역, 음성합성이 통합된 자동통역 시스템에 DNN 기술을 적용하였다고 밝힘. 페이스북은 2013년에 모바일 자동통역 앱인 지비고(Jibbigo)의 개발사인 Mobile Technologies를 인수하였고 페이스북은 DeepMind를 인수하기 위해 구글과 경쟁
  • 뉘앙스는 자사 음성인식 서비스 확산을 위해 모바일 단말 제조 진영과의 협력관계도 적극적으로 구축, 뉘앙스는 애플의 '시리', 삼성전자의 음성인식 서비스 'S 보이스(S Voice)' 등의 기술제휴사로 참여하면서 매년 10억 달러 이상의 매출을 달성
  • 해외 기업들은 인공지능 기술을 적용한 음성인식 기술의 연구를 활발하게 진행 중이며 특히 아마존, 애플, 페이스북, 구글 등이 선두
  • 아마존은 음성인식 기술과 스피커를 결합한 에코를 통해 음성명령으로 음악을 실행하고 뉴스나 교통상황 등을 검색하여 사용자에게 알려주는 서비스를 제공 중

(2) 국내동향

  • 국내 음성검색 시장은 2010년 6월 다음이 스마트폰용 모바일 음성검색 서비스를 최초로 선보인 이후 곧바로 구글이 인식률 높은 한국어 버전 음성검색 서비스를 출시하였으며, NHN도 자체 개발을 통해 인식률을 개선한 검색서비스를 발표하여 경쟁을 펼치고 있음
  • Voiceware는 Microsoft에 음성 합성기를 제공 한 데 이어 미국 및 호주 등지에 영어 TTS(Text To Speech)제품을 공급하는 등 시장을 주도
  • HCI Lab 역시 다음에 음성검색 솔루션을 제공한 데 이어 콜센터, 금융, 교육, 텔레매틱스 분야에서 경쟁
5.핵심요소기술 선정

확정된 요소기술을 대상으로 중소기업에 적합한 핵심요소기술 선정

[ 음성인식 SW 분야 핵심요소기술 ]

음성인식 SW 분야 핵심요소기술
분류핵심 요소기술개요
음성인식 기술 음성인식 기술 사용자가 발성한 음성을 분석하고 인식하는 기술 음성전처리, 음성분석, 음향모델링, 탐색기술 등 (음성인식, 음성이해, 음성분석, 음향모델, 패턴매칭, 대화체 음성인식, 대어휘 연속어 인식, 고속 탐색기술, 언어모델링, 다국어 음성인식)
음성합성 기술 사용자에게 전달할 문장을 음성으로 합성하여 출력하는 기술 (문서전처리기술, 문자, 발음 변환기술, 운율제어기술, 음색변환 기술)
언어처리 기술 언어분석기술 사용자의 대화문장을 이해하고 자연스러운 대화를 유도하는 기술 (대화 모델링 기술, 대화이해 기술, 대화생성 기술)
자동번역 기술 인공지능을 사용한 신경망 번역 등 이종간 언어를 자동으로 번역해 주는 기술
음성 및 언어
인터페이스 기술
음성기반 명령 및 제어 기술 사용자 음성을 인식하여 명령을 받아들이고 분석 및 제어하는 기술
대화형 질의응답 시스템 기술 사용자 의도를 이해하여 복잡한 의도를 가진 정보검색을 할 수 있는 기술