WenGe

帅气的我简直无法用语言描述!
MaskGCT

MaskGCT

一个功能强大的语音合成大模型,它不仅在技术上达到了行业领先水平,还在多语言支持、声音克隆和语音控制等方面表现出色
719133
Roop

Roop

一个功能强大的换脸工具,以其简单易用和高性能的特点,为用户提供了一种便捷的方式来实现视频中的面孔替换
1,428279
STranslate

STranslate

一款实用的翻译和OCR工具,以其即用即走的特点、开源免费的优势以及社区支持的便利性,为用户提供了高效、便捷的文本处理解决方案
728119
Seed-VC

Seed-VC

一个创新的声音转换工具,它通过零样本学习技术,能够在不需要特定目标音色样本的情况下实现高质量的声音转换
1,106271
Unique3D

Unique3D

个创新的单图像 3D 网格生成工具,以其高保真度、高效训练和优化以及强泛化能力脱颖而出
1,191260
GameNGen

GameNGen

由谷歌推出的世界首个完全由AI驱动的游戏引擎,旨在颠覆传统的游戏开发方式。这个引擎利用神经网络实时生成游戏画面,无需手动编写代码
7,021429
VideoDoodles

VideoDoodles

一个极具创意和实用性的工具,它将手绘艺术与视频编辑相结合,为视频创作者提供了一种全新的表达方式
1,440254
RMBG-2.0

RMBG-2.0

由BRIA AI推出的一款下一代图像背景移除模型,它基于创新的BiRefNet架构,能够在复杂环境中提供高精度的背景移除结果
766387
GPT-SoVITS

GPT-SoVITS

一个功能强大的开源声音克隆项目,它通过创新的少量样本学习技术,使得用户能够快速训练出高质量的文本到语音模型
1,173247
NotebookLlama

NotebookLlama

Meta推出的将PDF文档转换成播客内容的开源项目。项目基于一系列自动化步骤实现,用LLaMa模型进行PDF预处理、生成播客脚本、增加戏剧化元素及文本转语音合成
1,219125
FunAudioLLM

FunAudioLLM

由阿里巴巴集团通义语音团队开发的框架,旨在增强人类与大型语言模型(LLMs)之间的自然语音交互
683472
EasyAnimate

EasyAnimate

基于Transformer架构的视频生成工具,提供了高效、灵活的视频生成解决方案
1,054188