최근 연구에 따르면 카돔의 음성 사용자 인터페이스 기술은 까다로운 음향 조건에서도 90% 이상의 정확도를 달성하는 것으로 나타났습니다.

카르돔이 표준 음성 인식 알고리즘을 능가한다는 새로운 연구 결과 발표

최근 연구에 따르면 카돔의 음성 사용자 인터페이스 기술은 까다로운 음향 조건에서도 90% 이상의 정확도를 달성하는 것으로 나타났습니다.

로라 테이트
로라 테이트
증권 시세 표시기
제품 업데이트

목차

여기에서 연구를 다운로드하십시오.

배경 소음 및 잔향, 에코 및 스피커와의 거리를 포함하여 ASR(자동 음성 인식) 시스템의 성능에 영향을 미치는 많은 요인이 있습니다.

경쟁력을 유지하려면 음성 지원 장치 제조업체와 OEM(주문자 상표 부착 방식)이 이러한 문제를 극복해야 합니다.

Kardome의 음성 인식 향상 기술은 음성 및 음성 인식 장치가 더 높은 정확도로 수행 할 수있게 해주는 소프트웨어 기반 솔루션입니다. 최첨단 신호 처리 기술을 사용하여 시끄러운 환경과 거리에서 우수한 성능을 달성합니다.

이 기술의 중요한 요소는 단일 스피커의 음성을 환경의 다른 음성 및 배경 소음과 분리하고 매우 정확한 ASR을 위해 집중하는 것입니다.

음성 인식 기술의 정확성을 보여주기 위해 다른 상용 기술과 비교하여 실제 환경에서 편견없는 연구를 수행했습니다.

우리 엔지니어 팀은 다양한 환경에서 Alexa 및 Google Home에서 사용되는 것과 같은 표준 음성 인식 알고리즘의 성능과 비교하여 Kardome의 성능을 분석했습니다.

우리는 연구의 일환으로 전형적인 거실 환경에 배치 된 스마트 스피커를 사용하여이 연구를 수행했습니다. 우리는 스마트 스피커의 ASR 시스템이 다양한 시뮬레이션 시나리오에서 얼마나 잘 수행되는지 확인하고 싶었습니다.

우리는 라우드 스피커를 사용하여 텔레비전, 주방 (믹서, 흐르는 물, 요리하는 사람 포함), 팬, 진공 청소기 및 삐걱 거리는 소음 (멀티 스피커 대화)과 같은 다양한 환경 소음원을 재생했습니다. 우리는 각 유형의 사운드를 다양한 볼륨으로 재생하여 서로 다른 신호 대 잡음비 조건에서 ASR의 정확도를 평가할 수있었습니다.

Kardome 엔지니어들은 다음과 같은 업계 표준 지표를 사용하여 스마트 스피커의 ASR 성능을 테스트했습니다.

  • FRR(Wake Word False Rejection Rate): 절전 모드 해제 단어가 있을 때 시스템에서 깨우기 단어를 감지하지 못하는 비율입니다.
  • Wake Word FAR(Wake Word False Alarm Rate): 시스템이 절전 모드 해제 단어가 없을 때 이를 감지하는 비율입니다.
  • 응답 정확도: 명령이 성공적으로 실행되는 비율입니다.

다음은 결과 요약입니다.

  • Kardome은 웨이크 워드 FRR 검출 테스트에서 90% 이상의 정확도를 달성했습니다.
  • Kardome은 소음 수준이 높은 조건을 포함하여 모든 환경에서 표준 알고리즘을 60 ~ 80 % 능가했습니다.
  • Kardome의 응답 정확도는 표준 알고리즘보다 80% 앞섰습니다. 

Kardome의 기술은 최첨단 음성 인식 기술을 발전시킵니다. 세계가 더 많은 청취자 기반 통신 모델로 이동함에 따라 정확한 전사 및 이해를 보장하기 위해서는 더 나은 음성 인식 기술이 필수적입니다.


Kardome의 VUI 기술에 대해 자세히 알아보려면 당사에 문의하십시오.

여기에서 전체 연구를 다운로드하십시오.

지금 시작하기

사용자
목소리 제공

카돔의 VUI 기술은 모든 음성 지원 플랫폼 또는 스마트 기기와 통합할 수 있습니다.

감사합니다! 제출이 접수되었습니다! 담당자가 곧 연락을 드릴 것입니다.
죄송합니다! 양식을 제출하는 동안 문제가 발생했습니다.

다중 스피커 격리

배경 소음 제거

정확한 음성 인식