차량 내 음성 인식 - 실험적인 VUI 연구
제품 업데이트

차량 내 음성 인식 - 실험적인 VUI 연구

카르돔의 기술은 여러 개의 스피커와 주변 소리가 있는 실제 생활에서 VUI가 작동할 수 있게 해줍니다.

다니 체르카시키 박사
다니 체르카시키 박사
공동 창립자 CEO

목차


Voicebot.AI 최근 연구에 따르면 소비자의 약 60%가 음성 비서가 신차 구매 기준의 요인이라고 답했습니다. 모든 소비자의 20% 이상이 차량 내 음성 비서 경험이 "중요한 고려 사항" 또는 "요구 사항"이라고 말합니다.

이 같은 연구는 또한 자동차에서 음성 인터페이스 사용자의 약 50 %가 지난 2 년 동안 음성 사용자 인터페이스 (VUI) 성능에 큰 개선이 없었다 고 생각 것으로 나타났습니다. 

오늘날 대부분의 사람들은 여전히 자동차의 VUI를 기존의 터치 스크린과 버튼을 대체 할 수있는 견고한 인터페이스가 아닌 가젯으로 간주합니다. 지난 10년간 음성 인식 엔진이 개선되었지만, 자동차의 VUI 성능은 신뢰성이 제한적입니다. 간섭 음성 신호 및 운전 소음은 최첨단 음성 인식 엔진에 도전합니다.

그림 1: 음성 제어 매뉴얼

오늘날 자동차 제조사들은 BMW와 유사한 자동차 내 VUI 시스템에 대한 매뉴얼을 공급하고 있습니다. 이러한 매뉴얼은 VUI가 작동하기에 적합한 환경을 조성하는 데 사용자에게 책임을 집니다.

사용자에 대한 일반적인 지침은 다음과 같습니다 : "배경 소음을 피하십시오", "음성 명령이 발행되는 동안 승객에게 말하지 말것을 요청하십시오"와 유사한 지침이 있습니다. 당연히, 사용자는 신뢰와 참여를 감소 기계에 의해 이해되지 않음으로써 자신을 좌절 찾을 수 있습니다. 

카르돔이 들어서있는 곳입니다. Kardome의 기술을 통해 VUI는 여러 개의 스피커와 주변 사운드가 있는 실제 생활에서 작동할 수 있습니다. Kardome의 소프트웨어는 여러 사용자가 동료 승객의 간섭없이 동시에 장치와 통신 할 수 있도록하여 시끄러운 자동차에서 사람들을위한 음성 기술을 작동합니다. 카르돔은 최적의 도로 안전과 우수한 운전자/승객 VUI 경험을 보장합니다. 

이 문서는 음향 솔루션 및 사운드 진동 분석의 선두 주자인 HEAD 음향 GmbH가수행한 실험 연구 결과를 공유합니다. 이 연구의 목표는 120kph로 주행하는 자동차에서 구글 스피치 투 텍스트(GSST) 엔진에서 얻은 음성 인식률(SRR)과 표준 핸즈프리 텔레포니(HFT) 오디오 스택, 그리고 카돔의 AI 구동 신호 분리 및 소음 감소 기술을 가를 평가 키트에포장한 두 가지 유형의 음성 처리 시스템과 비교하는 것입니다. 

그 결과 Kardome의 기술은 모든 유형의 사운드 환경에서 자동차의 음성 상호 작용 장치에 대한 음성 인식을 향상시킬 수 있음을 보여줍니다.

SRR 평가 설정 

카르돔의 가블 평가 키트는 표준 HFT 시스템의 마이크 옆에 르노 메가네 그랜드투어의 오버헤드 컴파트먼트에 설치되었습니다. 우리는 차량에 4 개의 인공 헤드 측정 시스템을 설치하여 전체 밴드 가 가능한 인공 입을 통해 연설을 전달했습니다.

그림 2: 4개의 인공 헤드 측정 시스템과 카르돔의 가블 평가 키트를갖춘 평가 설정.


우리는 세 가지 시나리오를 고려했습니다.

  1. 드라이버의 단독 연설
  2. 동시 스피커 2개, 드라이버 및 공동 드라이버
  3. 동시 스피커 4개

모든 시나리오에서 기존 차량 내 HFT 시스템과 카르돔의 가블 평가 키트는 음성 신호를 기록했습니다. HEAD 음향 엔지니어는 GSTT 출력 텍스트를 운전자의 실제 음성과 비교하여 음성 인식률을 테스트했습니다.

결과

도 3은 각 시나리오에 대한 SRR 성능을 나타낸다. 플롯의 각 빈은 세 가지 전략 각각에서 각각 의 두 신호 처리 방법(HFT 및 Kardome)에 의해 얻어진 SRR을 나타냅니다. 녹색 쓰레기통은 HFT와 파란색 쓰레기통과 카돔의 음성 클러스터링 시스템에 해당합니다.

자동차의 텍스트 성능에 대한 연설
그림 3: 차량에서 카르돔 및 표준 HFT 시스템을 사용할 때 GSTT 음성 인식률.

요약에서

Kardome의 AI 기반 신호 분리 및 노이즈 감소 기술은 고려된 모든 시나리오에서 SRR을 크게 개선했습니다. 간섭 음성 신호는 스피커 수가 증가함에 따라 핸즈프리 전화 시스템 결과를 크게 저하시켰습니다. 반면, Kardome은 스피커 수와 간섭 신호에도 불구하고 일관된 SRR 성능을 받았습니다.

카르돔과 같은 VUI 디자인을 사용하는 자동차의 음성 인식 기술을 개선하면 음성 보조 제조업체가 음성 인식의 비효율성을 극복하는 데 도움이 됩니다. 또한 자동차 제조업체가 곧 스마트 카 음성 도우미 기능을위한 붐비는 시장이 될 것입니다 무엇에 효과적으로 경쟁하는 데 도움이 될 것입니다. 

카르돔에 대해 자세히 알아볼 수 있는 메시지를 보내주십시오.


이 독서를 즐겼습니까?

받은 편지함으로 바로 전송되는 최신 비디오 비즈니스 뉴스, 전략 및 인사이트를 최신 상태로 유지하세요!

지금 시작하기

사용자
목소리 제공

카돔의 VUI 기술은 모든 음성 지원 플랫폼 또는 스마트 기기와 통합할 수 있습니다.

다중 스피커 격리

배경 소음 제거

정확한 음성 인식