MediaCraft 音视频工具 — 媒体创作处理软件

bobobo · 2025-11-03

MediaCraft 音视频工具是一款基于 PyQt5 + FFmpeg 开发的一站式音视频处理工具，提供图形化界面操作，让复杂的音视频处理变得简单易用。支持15大核心功能模块，满足从基础编辑到高级AI处理的各类需求。

详细介绍：

要查看链接，请先登录 or 注册

这是我自己用python整合ffmpeg和一些ai模型的UI界面工具，欢迎朋友们指点。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

核心功能详解

1. 工具设置

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

2. 屏幕录制

支持全屏录制或自定义区域录制，支持录制系统声音、录制麦克风声音，支持录制鼠标指针。可设置帧率（FPS）、编码质量（超快/快速/中等/慢速）、视频比特率（5000k-15000k或自定义）。支持暂停/继续/停止操作，默认保存到桌面。需要安装Screen Capturer Recorder用于屏幕捕获，VB-CABLE用于音频捕获。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

3. 视频水印

支持图片水印和文字水印两种模式。图片水印支持PNG/JPG格式，可设置宽度、高度和透明度（0-100%）。文字水印支持自定义字体（系统字体+程序fonts目录字体）、字号、颜色（HEX格式）、描边颜色、透明度。支持设置水印位置（水平/垂直偏移），支持批量处理多个视频文件，支持拖拽添加文件，支持覆盖已存在输出文件。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

4. 视频字幕

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

5. 视频合并

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

6. 视频转码

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

7. 提取字幕

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

8. 视频截图

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

9. 视频分割

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

10. 图片转视频

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

11. 视频添加音乐

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

12. 提取视频/音频

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

13. 媒体元数据修改

支持批量修改视频和音频文件的元数据信息，包括标题、艺术家、专辑、年份、描述等信息。修改后的元数据会显示在文件属性中。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

14. Whisper 生成字幕

支持使用Whisper AI模型批量从视频中提取文字字幕。支持多种模型选择（tiny/base/small/medium/large），平衡速度和精度。支持多语言识别（中文简体/繁体、英文、日语、韩语、法语、德语、西班牙语等），支持自动检测语言。支持字幕翻译功能，可将识别结果翻译成其他语言。支持多种字幕格式输出（SRT/ASS/VTT），自动命名规则：[原文件名]_[语言代码].格式。程序会自动检测Whisper路径和模型文件（系统安装或Plugin/whisper目录）。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

15. 声音克隆模型

程序内置了RTVC和SoVITS两个声音克隆模型，支持音频训练并生成克隆音频。RTVC支持实时语音转换和文本转语音（目前仅支持英文），需要输入文本和目标参考音频。SoVITS支持高质量音频克隆和多语言支持，需要输入源音频和目标参考音频，自动识别配置文件中的说话人列表。程序会自动检测模型完整性和Python环境。

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

MediaCraft 音视频工具 — 媒体创作处理软件

bobobo

Active member

Similar threads