Python Audio Transcription for Mandarin

Linux / Mac OS
Windows OS, run it using Docker
Python, version 3.7 - 3.11
Tensorflow, version 0.37.0 (use in this project)
Tensorflow IO, version 2.16.2 (use in this project)
librosa, version 0.10.2.post1 (use in this project)

Linux and Mac OS

Go to project directory

cd path/to/python/project/dir/py-audio-transcription-zh

Install the required library

pip install tensorflow==2.16.2 tensorflow-io==0.37.0

Using Docker

Run it with this Docker Image that contains required library :

docker pull krlan2789/python-tensorflow:1.0.1
docker run -it --rm -v path/on/your/machine/dir/py-audio-transcription-zh:path/on/docker/container/py-audio-trancription-zh krlan2789/python-tensorflow:1.0.1 bash

# Example
docker run -it --rm -v D:/Files/Documents/Python/Projects/py-audio-transcription-zh:/tmp/py-audio-trancription-zh krlan2789/python-tensorflow:1.0.1 bash

After entering the Docker Container terminal, run command below :

cd py-audio-trancription-zh

Scripts

Create Dataset

Run main.py to creating dataset.json file :

python main.py

Train Model

Run train.py to train model and save to .h5 file :

python train.py

Test Model

Run transcribe.py for testing the model :

python transcribe.py

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
dataset		dataset
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
audio_transcription_zh_base.bin		audio_transcription_zh_base.bin
audio_transcription_zh_base.h5		audio_transcription_zh_base.h5
char_to_index.json		char_to_index.json
convert_to_bin.py		convert_to_bin.py
dataset.json		dataset.json
index_to_char.json		index_to_char.json
main.py		main.py
train.py		train.py
transcribe.py		transcribe.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Python Audio Transcription for Mandarin

Linux and Mac OS

Using Docker

Scripts

Create Dataset

Train Model

Test Model

About

Releases

Packages

Languages

License

krlan2789/py-audio-transcription-zh

Folders and files

Latest commit

History

Repository files navigation

Python Audio Transcription for Mandarin

Linux and Mac OS

Using Docker

Scripts

Create Dataset

Train Model

Test Model

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages