AI-Study 27

Deep Learning Paper Review: (UNetGAN) Speech Enhancement

No 기본지식 내용 유투브 1 배치 정규화(Batch Normalization) 강좌 2 3 Paper Review UNetGAN: A Robust Speech Enhancement Approach in Time Domain forExtremely Low Signal-to-noise Ratio Condition Author : Xiang Hao, Xiangdong Su, Zhiyu Wang , Hui Zhang and Batushiren Data : 29 Oct 2020 [ Abstract ] SNR이 매우 낮은 조건에서 Speech Enhancement은 매우 어려운 문제이고, 이전 연구에서 거의 조사되지 않았다. 이 논문은 이러한 문제를 처리하기 위한 U-Net 및 생성적 적대적 학습(Generati..

AI-Study 2021.06.24

Deep Learning Paper Review: (FULLSUBNET) Speech Enhancement

No 기본지식 내용 유투브 1 배치 정규화(Batch Normalization) 강좌 2 LSTM 쉽게 이해하기 강좌 3 Sequence Data를 위한 RNN & LSTM 강좌 Paper Review FULLSUBNET: A FULL-BAND AND SUB-BAND FUSION MODEL FOR REAL-TIMESINGLE-CHANNEL SPEECH ENHANCEMENT Author : Xiang Hao, Xiangdong Su, Radu Horaud , and Xiaofei Li Data : 24 Jan 2021 [ ABSTRACT ] 이 논문에서는 단일 채널 실시간 Speech Enhancement를 위해 FullSubNet으로 명명된 Full-band 및 Sub-band 퓨전(융합) 모델을 제안한..

AI-Study 2021.06.22

Deep Learning Paper Review: (SEGAN) Speech Enhancement

[참고 유투브 강좌] No 강좌제목 동영상 보기 1 10분안에 배우는 머신러닝 GAN 알고리즘 원리와 응용분야 강좌보기 2 GAN: Generative Adversarial Networks (꼼꼼한 딥러닝 논문 리뷰) 강좌보기 Paper Review SEGAN: Speech Enhancement Generative Adversarial Network Author : Santiago Pascual1 , Antonio Bonafonte1 , Joan Serra` 2 Data : 9 Jun 2017 [ Abstract ] 현재 Speech Enhancement 기술은 스펙트럼 Domain(Frequency)에서 작동하거나 일부 상위 수준 특성(feature)를 활용한다. 대부분은 제한된 수의 Noise Con..

AI-Study 2021.06.21

Deep Learning : Speech Enhancement -APPENDIX

"PHASE-AWARE SPEECH ENHANCEMENT WITH DEEP COMPLEX U-NET (ICLR 2019)" 저자: Hyeong-Seok Choi, Jang-Hyun Kim, Jaesung Huh, Adrian Kim, Jung-Woo Ha, Kyogu Lee APPENDIX A. REAL-VALUED CONVOLUTION & COMPLEX-VALUED CONVOLUTION 이 섹션에서, 우리는 Real-valued Convolution과 Complex-valued Convolution 간의 차이를 다룬다. Real-valued Matrices인 A와 B를 가지는 Complex-valued Convolution 필터 W = A + iB 가 주어지면, (b)와 같이 Complex-valued..

AI-Study 2021.06.19

Deep Learning : Activation Function(활성화 함수) 종류

활성화 함수 : 딥러닝 네트워크에서는 노드에 들어오는 값들에 대해 곧바로 다음 레이어로 전달하지 않고 주로 비선형 함수를 통과시킨 후 전달한다. 이때 사용하는 함수를 활성화 함수(Activation Function) 이라 부른다. 여기서 주로 비선형 함수를 사용하는 이유는 선형함수를 사용할 시 층을 깊게 하는 의미가 줄어들기 때문이다. "밑바닥부터 시작하는 딥러닝" 에서 인용 "선형함수인 h(x)=cx 를 활성화함수로 사용한 3층 네트워크를 떠올려 보세요. 이를 식으로 나타내면 y(x)=h(h(h(x))) 가 됩니다. 이는 실은 y(x)=ax와 똑같은 식입니다. a=c3이라고만 하면 끝이죠. 즉, 은닉층이 없는 네트워크로 표현할 수 있습니다. 뉴럴네트워크에서 층을 쌓는 혜택을 얻고 싶다면 활성화함수로는 ..

AI-Study 2021.06.17

"푸리에 변환"(Fourier Transform)의 기초(Foundation!).. (유투브 강좌)

1. 푸리에 변환 기본 빠르게 개념 잡기 NO 유투브 강의 내용 강의보기 1강 삼각함수 사인 & 코사인 ("그려보는 수학") ▶ 유투브강의 2강 푸리에변환-1.관점의 변환 : 시간 vs. 주파수 ("그려보는 수학") ▶ 유투브강의 3강 푸리에변환-2.푸리에 급수 ("그려보는 수학") ▶ 유투브강의 4강 푸리에변환-3.오일러 공식 ("그려보는 수학") ▶ 유투브강의 5강 푸리에변환-4.리만 적분 ("그려보는 수학") ▶ 유투브강의 6강 푸리에변환-5.내적 직교성 ("그려보는 수학") ▶ 유투브강의 7강 푸리에변환-6.원리와 예시 ("그려보는 수학") ▶ 유투브강의 전체 "그려보는 수학(1강 ~ 7강)" 유투브 강의 [전체 보기] 푸리에 변환에 반드시 필요한 4가지 개념 푸리에 변환을 완벽하게 이해하기 위해..

AI-Study 2021.06.09

Deep Learning Paper Review: (DCUnet) Speech Enhancement

[선행 학습 필요한 항목] NO 내용 사이트 1 Fourier Transform 개념 강좌1, 2 Magnitude와 Phase의 개념 강좌1, 3 U-Net 기본 개요 강좌1, 강좌2 Paper Review "PHASE-AWARE SPEECH ENHANCEMENT WITH DEEP COMPLEX U-NET (ICLR 2019)" 논문 (SNU & NAVER) : 공부하기(논문 링크) 저자: Hyeong-Seok Choi, Jang-Hyun Kim, Jaesung Huh, Adrian Kim, Jung-Woo Ha, Kyogu Lee [ABSTRACT] Speech Enhancement를 위한 대부분의 딥 러닝 기반 모델은 재구성을 위해 잡음이있는 음성의 Phase를 재사용하면서 Spectrogram의 ..

AI-Study 2021.06.05
반응형