一项由 MyShell 团队开发的多功能即时声音克隆技术,只需提供简短音频样本,即可克隆原发言者的声音,生成多种语言语音,支持高精度音色克隆、灵活的声音风格调控以及无需样本的跨语言声音克隆。
一款开箱即用的翻译和OCR工具,支持多种翻译方式、多家翻译服务、离线OCR、回译、TTS等功能,提升翻[…]
一款基于Gradio开发的开源工具,能够对图像中的人物进行实时面部表情精确控制,如微笑、眨眼、摇头等,支持[…]
一款简单易用的OCR文档工具,支持PDF、Docx、图像等文件格式,可将文件转换为图像后利用gpt-[…]
一款基于大型语言模型构建的功能强大的文档解析开源工具,可以轻松处理PDF、PPT、Word、Excel等常[…]
一款开源的AI互动式图像编辑工具,用户只需通过画笔涂抹和简单提示词,即可轻松实现插入元素、擦除物体、调整颜[…]
一款开源的AI工具,利用Calibre和CoquiTTS将电子书转换为高质量的有声读物,支持多种[…]
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 *
显示名称 *
邮箱 *
网站
在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
一款开箱即用的翻译和OCR工具,支持多种翻译方式、多家翻译服务、离线OCR、回译、TTS等功能,提升翻[…]