오니온에이아이 공식블로그

# Audio Source Separation

# Speaker Diarization

# Noise-Robust Speech-to-Text

# Speech Enhancement

# Cross-Lingual Text-to-Speech

오니온에이아이 3

[기술소개] 광주 AI기반 음성 인식🎧기술소개 오니온에이아이

안녕하세요 광주AI번역 서비스 오니온에이아이 입니다. 달고나 열풍을 불러왔던 '오징어 게임'도 더빙 서비스를 제공 했지만, 대부분 몰입도의 문제로, 자막을 통해 시청했습니다. ​ 비디오 콘텐츠의 AI음성인식률 한계로 동기화 구간 설정 시 어려움이 존재해 정확한 시간 검출이 어려웠습니다. ​ 화자의 음색 변환 연구로 톤을 바꿀 수는 있지만, 운율 및 감정을 포함한 변환이 어려워 표현력 있는 음성합성에 한계가 있었습니다. ​ 더빙의 경우, 발음과 립싱크를 맞추는 과정이 필수로 필요한데요. 언어의 차이로 인한 립싱크 문제로 신규 오디오 트랙의 생성 혹은 영상 자체에 대한 수정이 불가피 했습니다. ​ 오니온 광주AI번역 서비스는 음성 분리 기술을 통해 음원 분리를 하고, 잡음과 잔향을 제거하였고, 주파수 대역을..

AUNIONAI 오니온에이아이 : 온라인 AI기반 더빙 서비스

안녕하세요, 오니온에이아이 입니다😉 요즘 OTT서비스를 이용하지 않고 있는 사람을 찾기 힘들만큼 OTT서비스는 전 세계적으로 활발하게 이용되고 있습니다. ​ 스마트 홈, 모바일, 웨어러블 장치 보급 확대에 따라 ​ 개인 및 가정과 기업 부문의 발화 및 음성인식 기능이 빠르게 성장할 것으로 예상되는데요. 음성인식 기술은 사람의 음성을 컴퓨터가 알아듣고 문자로 전환해주는 일련의 과정으로, ​ STT(Speech-To-Text) 라고도 부릅니다. ​ ​ 요즘 일반적인 대화나 회의 내용을 텍스트로 변환시켜주는 앱이 많은데, 이것이 음성 인식의 대표적인 사례입니다. 음성 합성은 음성 인식과 반대로 사람의 음성을 합성하는 기술인데요. 이 기술을 이용하면 특정 인물의 음성을 합성하는 것이 가능하게됩니다. ​ 이러한 ..

[📣AUNION NEWS] AI음성 기반, 원하는 목소리 콕 찍어 키워 듣는다

좋아하는 음악 그룹의 공연장을 찾아 손수 녹화까지 했다. 가장 좋아하는 멤버를 중심으로 정성껏 촬영했는데, 막상 틀어보니 그 멤버의 목소리는 다른 가수의 노래와 함성에 묻혀 들리지 않는다. 영상만으로 만족해야 할까. ​ 원하는 부분만 확대하는 ‘줌’ 기능, 음악에서도 가능해 이미 녹화된 영상에서 한 명 한 명 원하는 사람의 목소리를 따로 들을 수 있는 기술이 나왔다. ​ 김홍국 광주과학기술원(GIST) 전기전자컴퓨터공학부 교수팀은 스테레오로 녹음된 영상에서 원하는 사람, 원하는 악기의 소리만 골리 들을 수 있는 ‘오디오 줌’ 기능을 개발했다. ​ 김 교수는 “가수의 음악에서 내가 특히 더 좋아하는 가수만 ‘줌’ 기능을 이용해 따로 확대해 볼 수는 있어도 목소리만 따로 듣는 기술은 기존에 없었다”라며 “청..