音乐语音

FineVoice是一种人工智能数字语音解决方案，可以帮助用户增强声音，并实时改变声音。它配有实时变声器，无限的音频和声音效果，录音室质量的录音机，文本到语音，语音到文本。

Text-To-Song

将文本转换成歌曲的工具。它使用自然语言处理将文本输入转换为音频组合。该工具允许用户从各种音乐风格和乐器中进行选择，以及调整节奏、键和动态等参数。生成的音轨可以导出为高...

Verbatik

Verbatik是一款由人工智能驱动的文本到语音生成器，提供了一个不断增长的库，包含142种语言和口音的600多种自然声音。

SpeechEasy

SpeechEasy是一种合成语音解决方案，可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台，支持桌面和移动设备，有近12种高质量的合成声音可供选择。它使用简单...

逗哥配音神器

逗哥配音是一款500w+达人热推的的AI配音软件，独有的AI智能配音技术,更专业,更完美贴近真人配音。内置丰富的短视频创作工具，文案提取、人声分离等短视频必备功能，逗哥配音是你短视频创作不二的选择！

FakeYou

名人语音生成器多功能趣味 AI 创意工具平台

IBM

越的多语言语音合成云服务

MURF.AI

在几分钟内制作出录音棚品质的配音。将 Murf 逼真的 AI 声音用于播客、视频和所有专业演示

LOVO.AI

LOVO AI是一个功能强大的AI语音生成器，它通过提供多样化的语音选项和易用的编辑工具，帮助用户快速创建引人入胜的视频和音频内容。

Fish Audio

一个专注于生成式人工智能（AI）的文本转语音（TTS）和声音克隆工具。它提供了一个强大的语音代理解决方案，支持多种语言，并且可以快速克隆声音，适用于配音、语音合成等多种场景

Resemble AI

Resemble.ai的AI语音生成器是一个完整的生成式语音AI工具包，允许您在几秒钟内创建类似人类的声音。

FishSpeech

由 FishAudio 团队开发的开源、先进的多语言文本到语音（TTS）合成项目。它旨在通过结合大语言模型（LLM）技术，提供高质量、多语言的语音合成解决方案。

Narration Box

Narration Box是一种语音合成服务，用户可以创建画外音、旁白、有声读物、音频页面、播客等。它拥有超过700个人工智能增强的仿人叙述者，支持20多种语言，功能强大的语音编辑器，以及博客和新闻网站的音频小部件。它还包括常见问题解答、反馈、更新等资源。它是免费的，并提供了分发、分析、盈利等工具。

Text To Speech

构建自然说话的应用和服务，从 147 种语言和变体中选择 456 种语音

Dubbingx

全球唯一、多情绪、多语态、全可控的AI配音产品

Dubbing大饼AI声音

大饼AI变声器，自然人声效果，千种音色选择，全场景接入支持

蓝藻AI

运用了尖端的创造性人工智能技术，致力于向用户提供流畅的自然语言处理与生成服务。这涵盖了从文字到语音的转换、语音辨识以及对话管理等多项功能。

AI音乐生成

更多+

Audiocraft/MusicGen

一个简单而可控的音乐生成LM，具有文本和旋律调节。

人工智能音乐生成器：轻松制作翻唱歌曲

Noisli

Listen to soothing nature ambient noise like rain, ocean, pink, brown and white noise sounds and create relaxing soundscapes. Plus online timer and text editor.

DEEP MUSIC

为音乐行业提供新的体验和方案

Melodisco

Melodisco 作为一个 AI 音乐播放器，为音乐爱好者提供了一个新颖的平台，让他们能够探索由 AI 创作的音乐世界。

Moises

Moises 是一款专为音乐人设计的应用程序，它通过人工智能技术提供了一系列音乐制作和练习的工具。

FineShare Singify

Singify 作为一个 AI 驱动的歌曲翻唱生成器，为用户提供了一个创新的方式来重新演绎和享受音乐。

songR

一款基于人工智能的歌曲生成器。

反谱

实现识别五线谱图片，将五线谱图片转成简谱、将音乐（如 mp3、flac、ogg 等格式）中的旋律转换成人能辨识的音乐符号（如 MIDI 格式或五线谱或简谱文件），支持在线 MIDI 编辑创作下载导出。实现将带有人声演唱的音乐分离成只有乐器演奏的伴奏和只有人声演唱的声音、可用于BGM制作的免费应用。实现识别五线谱图片或PDF文件。

唱鸭

音乐创作全流程的AI自动作曲工具，集 AI 辅助作词、AI 自动作曲、编曲、混音于一体

音剪

专业音频制作，激发创新灵感，释放创意潜力，让你的音频创作更自由、便捷和精彩

天空AI音乐

为音乐创作带来了一场革命，降低了音乐创作的门槛，让更多人有机会参与到音乐创作中来，并且能够创作出高质量、专业级的音乐作品，具有广阔的市场应用前景和发展潜力。

海绵音乐

海绵音乐，一个精选音乐的聚集地，致力于为用户提供各种风格的治愈系音乐。

天谱乐

凭借其音乐生成、智能推荐、音乐编辑等多种功能，极大地简化了音乐创作的过程，降低了创作难度

BGM猫

BGM猫提供版权背景音乐一站式服务,正版商业授权,AI智能生成曲库,免费无限,快捷授权,一键下载

Udio

Udio作为一个AI音乐生成工具，以其强大的个性化创作能力和适用于不同层次音乐人的特点，为音乐创作带来了新的可能性

歌歌AI

歌歌AI写歌是一个旨在让每个人都能成为音乐家的平台，它通过人工智能技术，提供了一种创新的方式来创作音乐。

天谱乐

凭借其音乐生成、智能推荐、音乐编辑等多种功能，极大地简化了音乐创作的过程，降低了创作难度

AI语音识别

Notta

Notta是由MIND CRUISER LIMITED推出的语音转写软件，主要针对个人使用，并在海外拥有数十万用户。这款软件具有录音实时转写、音/视频导入转写、文本多格式导出、音频标记等功能，并能实时录音时进行文字直播、插入图片等。

Whisper

Whisper是一个开源的自动语音识别系统，经过68万小时的多语言和多任务监督数据训练

adobe.podcast

AI驱动的音频增强语音通过消...

Otter.ai

Otter.ai是一个自动的会议记录和笔记工具，帮助团队充分利用他们的会议。它可以加入Zoom、Microsoft Teams或谷歌Meet会议，以记录和分享笔记，突出关键要点，并直接将会议幻灯片添加到笔记中。它还包括关键字的摘要和大纲，以帮助团队快速浏览会议笔记、搜索、阅读和播放音频。

Nuance

Nuance公司以其在对话式AI领域的专业知识，为医疗保健和客户参与提供创新解决方案。公司致力于通过AI技术推动组织效能，提升工作成效，并在全球范围内产生积极影响。

听脑AI

听脑AI是一款AI智能语音助手，专注于语音转文本和实时录音总结，提供音视频转文字、实时录音转文本、AI总结、章节速览等功能。用户可以通过自由拖动文本查看音视频进度，享受便捷的智能记录体验，通过智能化处理，以提升用户在会议、课堂、面试等场景的记录效率，让用户更便捷地获取和整理信息。

1 0

悦录

悦录依托同花顺的语音识别技术，为用户提供免费的录音转文字、语音转文字、视频字幕等服务，1小时音频最快5分钟出稿，准确率高达97%+，全程加密，文件信息安全。

悦音配音

AI智能配音工具，独有的AI智能配音技术，更专业，完美贴近真人配音，AI模仿真人情感（怀旧、欢快、激情、伤心、抒情、惊讶等），支持多音字、停顿、整数、小数、数字等特色发音，快捷的单人、多人配音模式，海量的音色库，近千种免费音色，覆盖短视频、政企宣传、教育、动漫、有声读物、影视广告等数百行业场景。

讯飞听见

讯飞听见作为一个高效、准确的语音转文字服务平台，能够帮助用户节省时间，提高记录整理的效率。同时，其企业版服务为团队提供了专属的培训和技术支持。

Speech Studio

Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法，可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。

TTS-Voice-Wizard

TTS语音向导是一种工具，允许用户通过微软Azure语音识别和TTS将语音转换为文本，然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项，包括100多种不同的声音，20多种支持的语言，并能够显示歌曲标题，艺术家和用户以上的进度。

Buzz

Buzz作为一个音频转录和翻译工具，凭借其离线运行、多种语言支持、易于安装和使用的优点，为用户提供了便捷的音频处理解决方案

播记

播记是一款专为播客创作者打造的智能shownotes生成工具。通过AI技术，帮助创作者快速生成高质量的播客shownotes，提升创作效率，优化内容管理。支持多种格式导出，让播客创作更轻松。

AI语音合成

更多+

1 0

MURF.AI

在几分钟内制作出录音棚品质的配音。将 Murf 逼真的 AI 声音用于播客、视频和所有专业演示

Resemble AI

Resemble.ai的AI语音生成器是一个完整的生成式语音AI工具包，允许您在几秒钟内创建类似人类的声音。

1 0

Voicebox

Voicebox 是由 Meta AI 研究团队开发的一款领先的语音生成模型。Voicebox 能够在六种语言中合成语音，消除瞬态噪声，编辑内容，在语言之间转移音频风格，并生成多样的语音样本。此外，它生成语音的速度比最先进的自回归模型快 20 倍。

voice.ai

voice.ai的使命是通过普及人工智能技术，增强协作创造力，并允许社区重新定义音频表达方式。公司相信人工智能应该是易于接近、对所有人开放且富有趣味的。

ChatTTS

ChatTTS是一个开源的专为对话场景设计的语音生成模型，特别适用于大语言模型(LLM)助手的对话任务，以及诸如对话式音频和视频介绍等应用。ChatTTS 不仅能说中文，英文也能 hold 住，还支持一些细粒度控制，它允许你加入笑声、说话间的停顿，还有语气词，可玩性很强。它通过使用大约100,000小时的中文和英文数据进行训练，ChatTTS在语音合成中表现出高质量和自然度，实现了自然流畅的语音合成，同时支持多说话人。