영상관련 그리고 오디오 관련 인식을 위해서, 우리는 최신트랜드인 ViT(Visual Transformer), AST(Audio Spectrogram Transformer)를 공부해야 함(엄밀히 말하면 AST 역시 ViT라고 보면 됨).그러나 ViT, AST를 공부하기 위해서는 먼저 RNN을 이해하고 Transformer 모델을 이해해야함. 아래에는 RNN 및 Transformer 모델을 쉽게 설명하는 유투브 사이트를 모아 놓았음. 열심히 공부하기를 바람. [김성범 교수 / 고려대학교,산업경영공학부] ■ [핵심 머신러닝] Transformerhttps://www.youtube.com/watch?v=a_-YgMO0u0E [신박AI] ■ 트랜스포머, 스텝 바이 스텝https://www.youtube.c..