Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Appearance settings

brojr/TF_PatternRecognition

Open more actions menu
 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

음성/음향 인식을 위한 딥러닝 기반 패턴인식기술 (with Tensorflow) 💻💬


통계/딥러닝 기반 인식기법 실습 IDE download: pycharm




📌 Dependencies

실험을 수행하는데 필요한 패키지를 정리한 파일입니다.

pip install -r requirements.txt



0️⃣ 특징 추출 단계 수행

log-mel spectrum(.ls)과 MFCC(.mfc) 특징을 추출하여 저장

python ./utils/feature_extractor.py

1️⃣ 모델 훈련 (반드시 isTrain값을 1로 설정)

사용할 특징과 모델을 매개변수로 넣어 훈련 (default: mel / gmm)

python train.py --isTrain 1 --data [특징타입] --model [모델]
  • MFCC 특징을 사용하여 CNN모델을 훈련할 경우 아래와 같이 수행
python train.py --isTrain 1 --data mfc --model cnn

2️⃣ 모델 추론 (반드시 isTrain값을 0으로 설정)

사용된 특징과 모델을 매개변수로 넣어 테스트 (default: mel / gmm)

python train.py --isTrain 0 --data [특징타입] --model [모델]
  • MFCC 특징을 사용하여 훈련된 CNN모델의 성능을 평가할 경우 아래와 같이 수행
python train.py --isTrain 0 --data mfc --model cnn

🔄 모든 단계를 일괄적으로 수행

  • 0~2단계를 선택하여 매개변수로 넣어 특징추출/모델훈련/모델추론 과정 수행
  • 선택한 단계의 상위 단계 모두 수행 (ex. --step 0; 0~2단계 수행)
python run.py --step [수행단계]



✔ Implemented features

log-mel spectrum (mel)
MFCC (mfc)

✔ Implemented models

KMEANS (kmeans)
GMM (gmm)
HMM (hmm)
FC-DNN (dnn)
CNN (cnn)
LSTM (rnn)



⏬ Dataset

  • UrbanSound8K는 8,732개 sample로 구성(10개 class, 4초이하)
  • Download form을 작성 후 다운 받아, repository에 있는 ./data/wav/* 에 압축해제



License

Copyright (c) 2020-IMPRESS.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%
Morty Proxy This is a proxified and sanitized view of the page, visit original site.