오니온에이아이 공식블로그

# Audio Source Separation

# Speaker Diarization

# Noise-Robust Speech-to-Text

# Speech Enhancement

# Cross-Lingual Text-to-Speech

오니온에이아이

[📣AUNION NEWS] AI음성 기반, 원하는 목소리 콕 찍어 키워 듣는다

AunionAI 2023. 11. 30. 16:42

 

 

[인간·공감·AI]조난자 소리, 원하는 가수 목소리 콕 찍어 키워 듣는다 [기사출처] 동아사이언스 - https://m.dongascience.com/news.php?idx=40694

 

좋아하는 음악 그룹의 공연장을 찾아

손수 녹화까지 했다.

가장 좋아하는 멤버를 중심으로

정성껏 촬영했는데,

 

막상 틀어보니 그 멤버의 목소리는

다른 가수의 노래와 함성에 묻혀 들리지 않는다.

영상만으로 만족해야 할까.

 

원하는 부분만 확대하는

‘줌’ 기능,

음악에서도 가능해

 

 

이미 녹화된 영상에서

한 명 한 명 원하는 사람의 목소리를

따로 들을 수 있는 기술이 나왔다.

 

김홍국 광주과학기술원(GIST)

전기전자컴퓨터공학부 교수팀은

 

 

스테레오로 녹음된 영상에서 원하는 사람,

원하는 악기의 소리만 골리 들을 수 있는

‘오디오 줌’ 기능을 개발했다.

 

 

김 교수는

“가수의 음악에서 내가 특히

더 좋아하는 가수만 ‘줌’ 기능을 이용해

따로 확대해 볼 수는 있어도

목소리만 따로 듣는 기술은 기존에 없었다”라며

 

 

“청각 인공지능(AI)을 응용해 이런 바람을 실현시키는 기술을 완성했다”

고 말했다.

 

실제로 기타를 치는 사람과

노래를 부르는 사람이 동시에 녹화된 영상의 경우, 영상을 시청하는 도중

가볍게 기타를 치는 사람 또는

노래를 부르는 사람을 터치하는 것만으로

그 사람의 소리만 선명히 골라 듣는 게 가능하다.

 

 

김 교수는

소리의 방향을 수정해서

그 방향에

해당하는 각도와

주파수만 찾는 필터를 이용해

원하는 사람의 소리만

골라내는 게 원리

라며

“나아가 원하는 가수의 목소리만

따로 추출해

다른 음원에 추가로

입히는 것도 가능하다”

고 말했다.

예를 들어 퀸의 보컬리스트

프레디머큐리의 목소리만 추출해

새로 녹음하는 다른 연주에 보컬로 입히는 것도

가능하다.

김 교수는

 

 “다양한 창조적인 음악 활동이 가능해질 것”

이라고 말했다.

 

김홍국 광주과학기술원(GIST)

전기전자컴퓨터공학부 교수팀은

청각 인공지능(AI)을 연구하고 있다.

영상에서 원하는 음만 골라 듣는

사운드 줌 기능부터

재난이나 사고 상황에서 상황을 인지하고

인명 구조를 하는 AI까지

청각 AI를 이용해 구현 중이다.