# Audio Source Separation
# Speaker Diarization
# Noise-Robust Speech-to-Text
# Speech Enhancement
# Cross-Lingual Text-to-Speech

좋아하는 음악 그룹의 공연장을 찾아
손수 녹화까지 했다.
가장 좋아하는 멤버를 중심으로
정성껏 촬영했는데,
막상 틀어보니 그 멤버의 목소리는
다른 가수의 노래와 함성에 묻혀 들리지 않는다.
영상만으로 만족해야 할까.
원하는 부분만 확대하는
‘줌’ 기능,
음악에서도 가능해
이미 녹화된 영상에서
한 명 한 명 원하는 사람의 목소리를
따로 들을 수 있는 기술이 나왔다.
김홍국 광주과학기술원(GIST)
전기전자컴퓨터공학부 교수팀은
스테레오로 녹음된 영상에서 원하는 사람,
원하는 악기의 소리만 골리 들을 수 있는
‘오디오 줌’ 기능을 개발했다.
김 교수는
“가수의 음악에서 내가 특히
더 좋아하는 가수만 ‘줌’ 기능을 이용해
따로 확대해 볼 수는 있어도
목소리만 따로 듣는 기술은 기존에 없었다”라며
“청각 인공지능(AI)을 응용해 이런 바람을 실현시키는 기술을 완성했다”
고 말했다.
실제로 기타를 치는 사람과
노래를 부르는 사람이 동시에 녹화된 영상의 경우, 영상을 시청하는 도중
가볍게 기타를 치는 사람 또는
노래를 부르는 사람을 터치하는 것만으로
그 사람의 소리만 선명히 골라 듣는 게 가능하다.
김 교수는
소리의 방향을 수정해서
그 방향에
해당하는 각도와
주파수만 찾는 필터를 이용해
원하는 사람의 소리만
골라내는 게 원리
라며
“나아가 원하는 가수의 목소리만
따로 추출해
다른 음원에 추가로
입히는 것도 가능하다”
고 말했다.
예를 들어 퀸의 보컬리스트
프레디머큐리의 목소리만 추출해
새로 녹음하는 다른 연주에 보컬로 입히는 것도
가능하다.
김 교수는
“다양한 창조적인 음악 활동이 가능해질 것”
이라고 말했다.
김홍국 광주과학기술원(GIST)
전기전자컴퓨터공학부 교수팀은
청각 인공지능(AI)을 연구하고 있다.
영상에서 원하는 음만 골라 듣는
사운드 줌 기능부터
재난이나 사고 상황에서 상황을 인지하고
인명 구조를 하는 AI까지
청각 AI를 이용해 구현 중이다.
| [기술소개] 광주 AI기반 음성 인식🎧기술소개 오니온에이아이 (0) | 2023.11.30 |
|---|---|
| AUNIONAI 오니온에이아이 : 온라인 AI기반 더빙 서비스 (0) | 2023.11.30 |