audioldm · GitHub Topics

Amphion (/æmˈfaɪən/) is a toolkit for Audio, Music, and Speech Generation. Its purpose is to support reproducible research and help junior researchers and engineers get started in the field of audio, ...

audio-generation audio-synthesis audioldm music-generation naturalspeech2 singing-voice-conversion speech-synthesis text-to-audio text-to-speech vall-e voice-conversion audit fastspeech2 vits emilia maskgct vocoder

Python 8.93 k

11 小时前

gitmylo / audio-webui

A webui for different audio related Neural Networks

人工智能 audioldm bark rvc text-to-audio text-to-speech 声音克隆 audiocraft music generative-music tts aio all-in-one

Python 1.15 k

8 个月前

ivcylc / OpenMusic

OpenMusic: SOTA Text-to-music (TTM) Generation

人工智能 diffusion-models music-generation text-to-audio ai-music audioldm diffusion-transformer dit hifi-gan vall-e

Python 550

2 个月前

Dartvauder / NeuroSandboxWebUI

#大语言模型#(Windows/Linux/MacOS) Local WebUI with neural network models (Text, Image, Video, 3D, Audio) on python (Gradio interface). Translated on 3 languages

gradio 大语言模型神经网络 Python stable-diffusion tts webui Whisper diffusers llamacpp transformers audioldm wav2lip cogvideox flux rvc

Python 95

15 天前

olaviinha / NeuralTextToAudio

Text prompt steered synthetic audio generators

text2audio audio-generation audio-synthesis audioldm music-generation voice-synthesis 声音克隆 audio audio-processing colab colab-notebook

Jupyter Notebook 46

1 年前

zelaki / DreamSound

Code for Investigating Personalization Methods in Text to Music Generation

dreambooth audioldm

Python 36

1 年前

camenduru / audioldm-colab

AudioLDM text to audio colab

colab colab-notebook text-to-audio audioldm

Jupyter Notebook 19

1 年前

TemporalLabsLLC-SOL / TemporalPromptEngine

A comprehensive, click to install, fully open-source, Video + Audio Generation AIO Toolkit using advanced prompt engineering plus the power of CogVideox + AudioLDM2 + Python!

人工智能 audio prompt-engineering Video audioldm cogvideox videogeneration

Python 19

4 个月前