음성/음향 인식을 위한 딥러닝 기반 패턴인식기술 (with Tensorflow) 💻💬

통계/딥러닝 기반 인식기법 실습 IDE download: pycharm

📌 Dependencies

실험을 수행하는데 필요한 패키지를 정리한 파일입니다.

pip install -r requirements.txt

0️⃣ 특징 추출 단계 수행

log-mel spectrum(.ls)과 MFCC(.mfc) 특징을 추출하여 저장

python ./utils/feature_extractor.py

1️⃣ 모델 훈련 (반드시 isTrain값을 1로 설정)

사용할 특징과 모델을 매개변수로 넣어 훈련 (default: mel / gmm)

python train.py --isTrain 1 --data [특징타입] --model [모델]

MFCC 특징을 사용하여 CNN모델을 훈련할 경우 아래와 같이 수행

python train.py --isTrain 1 --data mfc --model cnn

2️⃣ 모델 추론 (반드시 isTrain값을 0으로 설정)

사용된 특징과 모델을 매개변수로 넣어 테스트 (default: mel / gmm)

python train.py --isTrain 0 --data [특징타입] --model [모델]

MFCC 특징을 사용하여 훈련된 CNN모델의 성능을 평가할 경우 아래와 같이 수행

python train.py --isTrain 0 --data mfc --model cnn

🔄 모든 단계를 일괄적으로 수행

0~2단계를 선택하여 매개변수로 넣어 특징추출/모델훈련/모델추론 과정 수행
선택한 단계의 상위 단계 모두 수행 (ex. --step 0; 0~2단계 수행)

python run.py --step [수행단계]

✔ Implemented features

log-mel spectrum (mel)
MFCC (mfc)

✔ Implemented models

KMEANS (kmeans)
GMM (gmm)
HMM (hmm)
FC-DNN (dnn)
CNN (cnn)
LSTM (rnn)

⏬ Dataset

UrbanSound8K는 8,732개 sample로 구성(10개 class, 4초이하)
Download form을 작성 후 다운 받아, repository에 있는 ./data/wav/* 에 압축해제

License

Copyright (c) 2020-IMPRESS.

Name	Name	Last commit message	Last commit date
Latest commit History 19 Commits
config	config
utils	utils
.gitignore	.gitignore
README.md	README.md
requirements.txt	requirements.txt
run.py	run.py
train.py	train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

음성/음향 인식을 위한 딥러닝 기반 패턴인식기술 (with Tensorflow) 💻💬

📌 Dependencies

0️⃣ 특징 추출 단계 수행

1️⃣ 모델 훈련 (반드시 isTrain값을 1로 설정)

2️⃣ 모델 추론 (반드시 isTrain값을 0으로 설정)

🔄 모든 단계를 일괄적으로 수행

✔ Implemented features

✔ Implemented models

⏬ Dataset

License

About

Uh oh!

Releases

Packages

Languages

Search code, repositories, users, issues, pull requests...

brojr/TF_PatternRecognition

Folders and files

Latest commit

History

Repository files navigation

음성/음향 인식을 위한 딥러닝 기반 패턴인식기술 (with Tensorflow) 💻💬

📌 Dependencies

0️⃣ 특징 추출 단계 수행

1️⃣ 모델 훈련 (반드시 isTrain값을 1로 설정)

2️⃣ 모델 추론 (반드시 isTrain값을 0으로 설정)

🔄 모든 단계를 일괄적으로 수행

✔ Implemented features

✔ Implemented models

⏬ Dataset

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages