본문 바로가기

딥러닝으로 하루하루 씹어먹기30

딥러닝 TA 모델 - BERT (4 - create_pretraining_data) 2022.01.06 - [딥러닝으로 하루하루 씹어먹기] - 딥러닝 TA 모델 - BERT (3 - data_preprocess, BPE) 딥러닝 TA 모델 - BERT (3 - data_preprocess, BPE) 2022.01.05 - [딥러닝으로 하루하루 씹어먹기] - 딥러닝 TA 모델 - BERT (2 - Attention) 딥러닝 TA 모델 - BERT (2 - Attention) 2021.11.21 - [딥러닝으로 하루하루 씹어먹기] - 딥러닝 TA 모델 - BERT (1 - 기.. shyu0522.tistory.com 에서 이어집니다. 지난 시간에 언어 학습을 위한 단어책(vocab.list)를 만드는 과정(data_preprocess)에 대해서 알아보았다. data_preprocess과정은.. 2022. 1. 7.
딥러닝 TA 모델 - BERT (3 - data_preprocess, BPE) 2022.01.05 - [딥러닝으로 하루하루 씹어먹기] - 딥러닝 TA 모델 - BERT (2 - Attention) 딥러닝 TA 모델 - BERT (2 - Attention) 2021.11.21 - [딥러닝으로 하루하루 씹어먹기] - 딥러닝 TA 모델 - BERT (1 - 기초. 행렬과 벡터, 내적) 딥러닝 TA 모델 - BERT (1 - 기초. 행렬과 벡터, 내적) 이전 시간으로, STT(ESPNet)를 어느정도 시작부터.. shyu0522.tistory.com 여기서 이어집니다. 사실 BERT는 Attention은 그냥 기본이 되는 이야기이고, Attention 전/후로 Data를 학습시키기 좋은 형태로 변환하는 과정과, 그 것을 역전파로 학습시키기 위한 loss를 산정하는 과정에서의 역할이 더 중.. 2022. 1. 6.
딥러닝 TA 모델 - BERT (2 - Attention) 2021.11.21 - [딥러닝으로 하루하루 씹어먹기] - 딥러닝 TA 모델 - BERT (1 - 기초. 행렬과 벡터, 내적) 딥러닝 TA 모델 - BERT (1 - 기초. 행렬과 벡터, 내적) 이전 시간으로, STT(ESPNet)를 어느정도 시작부터 끝까지 다 설명한 것 같다. 시작할때는 이 많은 걸 언제 풀어쓰나, 걱정도 됬었지만, 결국 어느정도 잘 정리가 된 것 같았다. BERT는 현재 진행 중이 shyu0522.tistory.com 에서 이어집니다. Attention에 관련된 이야기는 LSTM으로 시계열 예측을 할 때, 내가 넣고 있는 Feature들에 대한 중요도를 알고싶어서, 시도 해본적이 있었고, 그 때 간략하게나마 적어놨던 아티클들이 있다. https://shyu0522.tistory.co.. 2022. 1. 5.
딥러닝 TA 모델 - BERT (1 - 기초. 행렬과 벡터, 내적) 이전 시간으로, STT(ESPNet)를 어느정도 시작부터 끝까지 다 설명한 것 같다. 시작할때는 이 많은 걸 언제 풀어쓰나, 걱정도 됬었지만, 결국 어느정도 잘 정리가 된 것 같았다. BERT는 현재 진행 중이며, 진행사항은 50%정도로, Pre-Training Model에 대한 실제 소스 분석과, Text 데이터 EDA와 전처리에 대한 고민(형태소+Wordpiece 적용 등), BERT 계열 모델들의 특성, 그리고 원래 BERT와는 소스적으로 무엇이 다른지 등등 앞단에서 벌어지는 부분들에 대한 분석이 완료 된 상태이다. 실제로 차주부터는 Fine-Tunning에 대한 고민들을 진행할 것이며, 예제들을 통한 소스 분석, 실제 자사 데이터로 문제 해결을 위한 PoC를 진행하고자 한다. (아마, 주제는 카테.. 2021. 11. 21.
딥러닝 STT 모델 - ESPNet (6 - Inference, Predict 시작!) 이번시간까지 정리를 하면, 얼추 STT는 종료가 되지 않을까 사료된다. 2021.10.25 - [딥러닝으로 하루하루 씹어먹기] - 딥러닝 STT 모델 - ESPNet (5 - 음성처리 도메인) 딥러닝 STT 모델 - ESPNet (5 - 음성처리 도메인) 지난 시간에는, 거의 딥러닝에 대한, ESPNet의 모델 아키텍쳐와 구조 흐름이 어떻게 흘러가고, 실제로 소스로 논문과 비슷하게 작성되어있는지 확인하는 작업까지 마쳤다. 글을 읽는 것 만으로는, shyu0522.tistory.com 기본적인 지식들, 기술에 대한 소개부터, Training, 음성에 대한 도메인을 다루었고, 모델을 사용해서 어떻게 예측할 것인가?에 대해서만 짚어보면, 더 이상 소개할 자료는 없을 걸로 판단된다. 이미 여기까지 진행을 해오면.. 2021. 11. 15.
딥러닝 STT 모델 - ESPNet (5 - 음성처리 도메인) 지난 시간에는, 거의 딥러닝에 대한, ESPNet의 모델 아키텍쳐와 구조 흐름이 어떻게 흘러가고, 실제로 소스로 논문과 비슷하게 작성되어있는지 확인하는 작업까지 마쳤다. 글을 읽는 것 만으로는, 길기도 길어서 보기 어렵고 난해할 수 있는데, 언제든지 질문은 환영이다! 2021.10.22 - [논문으로 현업 씹어먹기] - 딥러닝 STT 모델 - ESPNet (4 - Training 시작!) 딥러닝 STT 모델 - ESPNet (4 - Training 시작!) BERT 관련 프로젝트를 진행하면서 쓰려니, 왔다갔다 정신이 없다...ㅋㅋ 그래도 시간이 좀 되는거 같아 바로 이어서 가보도록 하자. 2021.10.21 - [논문으로 현업 씹어먹기] - 딥러닝 STT 모델 - ESPNet (3 shyu0522.tis.. 2021. 10. 25.
딥러닝 STT 모델 - ESPNet (4 - Training 시작!) BERT 관련 프로젝트를 진행하면서 쓰려니, 왔다갔다 정신이 없다...ㅋㅋ 그래도 시간이 좀 되는거 같아 바로 이어서 가보도록 하자. 2021.10.21 - [논문으로 현업 씹어먹기] - 딥러닝 STT 모델 - ESPNet (3 - 환경구성만 1 Article) 딥러닝 STT 모델 - ESPNet (3 - 환경구성만 1 Article) 오랜만에 블로그를 작성하는 것 같다. 최근에 서비스에 STT 모델을 학습시켜 사용해야하는 Task 때문에 정신이 없었다. 또한, 콜 예측 관련된 Task는 그냥 Base로 깔고가는 편이라, 너무 정신이 없었 shyu0522.tistory.com 서론 지난 시간에서 다뤘던 3가지 이야기들은, 1. ESPNet과 Kaldi의 설치 (Kaldi가 곁다리로 들어가면서 매우 복잡해.. 2021. 10. 22.
딥러닝 STT 모델 - ESPNet (3 - 환경구성만 1 Article) 오랜만에 블로그를 작성하는 것 같다. 최근에 서비스에 STT 모델을 학습시켜 사용해야하는 Task 때문에 정신이 없었다. 또한, 수요 예측 관련된 Task는 그냥 Base로 깔고가는 편이라, 너무 정신이 없었달까... 2021.05.24 - [논문으로 현업 씹어먹기] - 딥러닝 STT 모델 - ESPNet (2 - 톺아보기) 딥러닝 STT 모델 - ESPNet (2 - 톺아보기) ESPNet 논문은, 분명히 기술적인 내용들이었지만, 서술형일 뿐이었고, 상세 기술들은 하나하나 조사하다보니 너무 복잡한 느낌이 들었다. 2021.05.14 - [논문으로 현업 씹어먹기] - 딥러닝 STT 모델 - ES shyu0522.tistory.com 서론 ESPNet의 소스를 분석해보고, Training 환경을 구성해보고.. 2021. 10. 21.
딥러닝 STT 모델 - ESPNet (2 - 톺아보기) ESPNet 논문은, 분명히 기술적인 내용들이었지만, 서술형일 뿐이었고, 상세 기술들은 하나하나 조사하다보니 너무 복잡한 느낌이 들었다. 2021.05.14 - [논문으로 현업 씹어먹기] - 딥러닝 STT 모델 - ESPNet (1) 딥러닝 STT 모델 - ESPNet (1) BERT부터 설명을 하려고 하긴 했는데, 이제 곧 업무가 시작되기도 할 것이며, 최근에 논문을 읽어본 ESPNet에 대해서 먼저 정리해보겠다. 서론 사실 이전 회사에서, 크롤링 -> Text Analysis(TA) -> Power BI shyu0522.tistory.com 그럼 이 복잡하다면 복잡한 상세 알고리즘들을 어떻게 ESPNet처럼 합쳐서 수려하게 개발할 수 있었을까? ESPNet 자체를 톺아보려고 했지만, 설치부터 Data.. 2021. 5. 24.
728x90