一款由微软开源的工具,可将常见文件如 Word、Excel、PPT 等转换为 Markdown 格式,支持 OCR 和 AI 模型处理多媒体文件,提供命令行、Python API 和 Docker 三种使用方式。
一款开箱即用的翻译和OCR工具,支持多种翻译方式、多家翻译服务、离线OCR、回译、TTS等功能,提升翻[…]
一款基于大型语言模型构建的功能强大的文档解析开源工具,可以轻松处理PDF、PPT、Word、Excel等常[…]
一项由MetaAI发布的新技术,能够通过音频驱动生成全身逼真的虚拟人物对话,包括动作、表情和多人对话等,[…]
一项由MyShell团队开发的多功能即时声音克隆技术,只需提供简短音频样本,即可克隆原发言者的声音,生成多[…]
一款开源工具,能让AI智能体自动化操作浏览器,像真人一样理解网页内容并完成复杂任务,如投递简历、查询航班等[…]
一款开源的自动化AI播客生成工具,能够自动抓取网络新闻内容,并生成自然流畅的叙述性音频播客,提供简单易用的[…]
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 *
显示名称 *
邮箱 *
网站
在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
一款开箱即用的翻译和OCR工具,支持多种翻译方式、多家翻译服务、离线OCR、回译、TTS等功能,提升翻[…]