과학

KAIST, 인간 귀 모사한 초고감도 AI 음성인식 센서 상용화


  • 박은선 기자
    • 기사
    • 프린트하기
    • 크게
    • 작게

    입력 : 2021-02-15 20:06:24

    - 스마트폰과 인공지능 스피커에 활용...제품화 성공

    국내 연구진이 인간의 귀를 모사한 음향센서를 개발하고 세계 최초 상용화 길을 열었다.

    한국과학기술원(KAIST)는 15일, 신소재공학과 이건재 교수와 왕희승 박사팀이 공진형 유연 압전 음성 센서를 개발하고 이를 스마트폰과 인공지능 스피커에 탑재해 제품화하는 데도 성공했다고 밝혔다.

    ▲ 인공지능을 통한 화자 식별 개략도. /=KAIST 제공 

    KAIST에 따르면 인간이 먼 거리의 소리를 인식하는 방법은 달팽이관에 있는 사다리꼴 막이 가청주파수 대역에서 수많은 공진 현상을 발생시키며 소리를 증폭하는 원리에 있다.

    연구진은 이러한 원리의 효과를 극대화하기 위해 매우 얇은 유연 압전 막을 사용해 인간의 귀를 모사했고, 여러 공진 채널을 구현해 소리를 초고감도로 식별할 수 있는 공진형 음성 센서를 제작했다.

    이건재 교수팀은 이번 연구에서 센서 구조에 따른 공진, 주파수, 압전 막의 역할 등을 이론적으로 밝히고 크기를 매우 소형화함과 동시에 성능이 향상된 음성 센서를 개발했다.

    원거리에서 스마트 기기들을 정확하게 제어하는 미래 사물인터넷 기술과 음성을 암호화하는 보안기술을 연결함으로써 소비자 맞춤형 서비스 제공에 크게 이바지할 것으로 전망된다.

    ▲ 달팽이관 내 기저막을 모사한 모바일 압전 음성 센서의 원리. /=KAIST 제공 

    연구팀은 2018년 처음 제시한 이 같은 압전 음성 센서 개념을 발전시켜 교원 창업 기업인 '프로닉스'를 통해 시제품을 개발했다. 센서를 실제 스마트폰과 인공지능 스피커에 탑재해 성능 시험도 했다.

    생체 모사된 공진형 음성 센서는 신호 대 잡음비가 우수해 음성인식 기능이 뛰어나고, 인공지능 음성 서비스에 적은 데이터양으로도 화자 식별 정확도를 높이는 강점이 있다.

    ▲ 스마트폰 및 인공지능 스피커에 탑재된 유연 압전 음성 센서. /=KAIST 제공 

    이 음성 센서는 같은 조건에서 정전용량형 상용 마이크로폰과 성능 비교를 진행한 결과, 음성 분석 및 화자 식별에 있어 인식률을 높였고 조건에 따라 오류율을 60%에서 95%까지 줄일 수 있었다고 연구팀은 밝혔다.

    이건재 교수는 "프로닉스의 미국 지사를 통해 실리콘밸리 유수 IT 기업들과 협업을 추진하고 있다. 현재 대량생산 상용화 공정도 완성 단계에 있어 실생활에 곧 적용될 수 있을 것이다.”라고 말했다.

    연구 결과는 국제 학술지 '사이언스 어드밴시스'(Science Advances)에 지난 12일 자에 실렸다.


    베타뉴스 박은선 기자 (silver@betanews.net)
    Copyrights ⓒ BetaNews.net