MediaCraft 音视频工具 是一款基于 PyQt5 + FFmpeg 开发的一站式音视频处理工具,提供图形化界面操作,让复杂的音视频处理变得简单易用。支持15大核心功能模块,满足从基础编辑到高级AI处理的各类需求。
详细介绍:
这是我自己用python整合ffmpeg和一些ai模型的UI界面工具,欢迎朋友们指点。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
核心功能详解
1. 工具设置
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2. 屏幕录制
支持全屏录制或自定义区域录制,支持录制系统声音、录制麦克风声音,支持录制鼠标指针。可设置帧率(FPS)、编码质量(超快/快速/中等/慢速)、视频比特率(5000k-15000k或自定义)。支持暂停/继续/停止操作,默认保存到桌面。需要安装Screen Capturer Recorder用于屏幕捕获,VB-CABLE用于音频捕获。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
3. 视频水印
支持图片水印和文字水印两种模式。图片水印支持PNG/JPG格式,可设置宽度、高度和透明度(0-100%)。文字水印支持自定义字体(系统字体+程序fonts目录字体)、字号、颜色(HEX格式)、描边颜色、透明度。支持设置水印位置(水平/垂直偏移),支持批量处理多个视频文件,支持拖拽添加文件,支持覆盖已存在输出文件。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
4. 视频字幕
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
5. 视频合并
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
6. 视频转码
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
7. 提取字幕
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
8. 视频截图
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
9. 视频分割
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
10. 图片转视频
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
11. 视频添加音乐
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
12. 提取视频/音频
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
13. 媒体元数据修改
支持批量修改视频和音频文件的元数据信息,包括标题、艺术家、专辑、年份、描述等信息。修改后的元数据会显示在文件属性中。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
14. Whisper 生成字幕
支持使用Whisper AI模型批量从视频中提取文字字幕。支持多种模型选择(tiny/base/small/medium/large),平衡速度和精度。支持多语言识别(中文简体/繁体、英文、日语、韩语、法语、德语、西班牙语等),支持自动检测语言。支持字幕翻译功能,可将识别结果翻译成其他语言。支持多种字幕格式输出(SRT/ASS/VTT),自动命名规则:[原文件名]_[语言代码].格式。程序会自动检测Whisper路径和模型文件(系统安装或Plugin/whisper目录)。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
15. 声音克隆模型
程序内置了RTVC和SoVITS两个声音克隆模型,支持音频训练并生成克隆音频。RTVC支持实时语音转换和文本转语音(目前仅支持英文),需要输入文本和目标参考音频。SoVITS支持高质量音频克隆和多语言支持,需要输入源音频和目标参考音频,自动识别配置文件中的说话人列表。程序会自动检测模型完整性和Python环境。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
详细介绍:
这是我自己用python整合ffmpeg和一些ai模型的UI界面工具,欢迎朋友们指点。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
核心功能详解
1. 工具设置
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2. 屏幕录制
支持全屏录制或自定义区域录制,支持录制系统声音、录制麦克风声音,支持录制鼠标指针。可设置帧率(FPS)、编码质量(超快/快速/中等/慢速)、视频比特率(5000k-15000k或自定义)。支持暂停/继续/停止操作,默认保存到桌面。需要安装Screen Capturer Recorder用于屏幕捕获,VB-CABLE用于音频捕获。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
3. 视频水印
支持图片水印和文字水印两种模式。图片水印支持PNG/JPG格式,可设置宽度、高度和透明度(0-100%)。文字水印支持自定义字体(系统字体+程序fonts目录字体)、字号、颜色(HEX格式)、描边颜色、透明度。支持设置水印位置(水平/垂直偏移),支持批量处理多个视频文件,支持拖拽添加文件,支持覆盖已存在输出文件。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
4. 视频字幕
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
5. 视频合并
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
6. 视频转码
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
7. 提取字幕
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
8. 视频截图
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
9. 视频分割
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
10. 图片转视频
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
11. 视频添加音乐
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
12. 提取视频/音频
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
13. 媒体元数据修改
支持批量修改视频和音频文件的元数据信息,包括标题、艺术家、专辑、年份、描述等信息。修改后的元数据会显示在文件属性中。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
14. Whisper 生成字幕
支持使用Whisper AI模型批量从视频中提取文字字幕。支持多种模型选择(tiny/base/small/medium/large),平衡速度和精度。支持多语言识别(中文简体/繁体、英文、日语、韩语、法语、德语、西班牙语等),支持自动检测语言。支持字幕翻译功能,可将识别结果翻译成其他语言。支持多种字幕格式输出(SRT/ASS/VTT),自动命名规则:[原文件名]_[语言代码].格式。程序会自动检测Whisper路径和模型文件(系统安装或Plugin/whisper目录)。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
15. 声音克隆模型
程序内置了RTVC和SoVITS两个声音克隆模型,支持音频训练并生成克隆音频。RTVC支持实时语音转换和文本转语音(目前仅支持英文),需要输入文本和目标参考音频。SoVITS支持高质量音频克隆和多语言支持,需要输入源音频和目标参考音频,自动识别配置文件中的说话人列表。程序会自动检测模型完整性和Python环境。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━