• 本站招聘各个版块版主共同发展,有意可私聊站长

MediaCraft 音视频工具 — 媒体创作处理软件

Telegram账号购买找【ITCRY】-顶级号商 https://itcry.com/

bobobo

Member
Lv0
Lv1
Lv2
5
消息得分
注册
2025-07-19
消息
564
反馈评分
1
MediaCraft 音视频工具 是一款基于 PyQt5 + FFmpeg 开发的一站式音视频处理工具,提供图形化界面操作,让复杂的音视频处理变得简单易用。支持15大核心功能模块,满足从基础编辑到高级AI处理的各类需求。



详细介绍:



这是我自己用python整合ffmpeg和一些ai模型的UI界面工具,欢迎朋友们指点。





━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



核心功能详解



1. 工具设置



━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

69081275b50bc.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



2. 屏幕录制



支持全屏录制或自定义区域录制,支持录制系统声音、录制麦克风声音,支持录制鼠标指针。可设置帧率(FPS)、编码质量(超快/快速/中等/慢速)、视频比特率(5000k-15000k或自定义)。支持暂停/继续/停止操作,默认保存到桌面。需要安装Screen Capturer Recorder用于屏幕捕获,VB-CABLE用于音频捕获。



━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

69081275c19a5.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



3. 视频水印



支持图片水印和文字水印两种模式。图片水印支持PNG/JPG格式,可设置宽度、高度和透明度(0-100%)。文字水印支持自定义字体(系统字体+程序fonts目录字体)、字号、颜色(HEX格式)、描边颜色、透明度。支持设置水印位置(水平/垂直偏移),支持批量处理多个视频文件,支持拖拽添加文件,支持覆盖已存在输出文件。



━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

6908127f4e95a.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



4. 视频字幕



━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

6908127fde017.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



5. 视频合并



━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

69081280506d3.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



6. 视频转码



━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

69081281e39bd.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



7. 提取字幕



━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

690812827b531.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



8. 视频截图



━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

6908128a16732.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



9. 视频分割



━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

69081275e2f50.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



10. 图片转视频





━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

6908128a866ac.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



11. 视频添加音乐





━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

6908128a93cd9.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



12. 提取视频/音频





━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

6908128c7afb5.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



13. 媒体元数据修改





支持批量修改视频和音频文件的元数据信息,包括标题、艺术家、专辑、年份、描述等信息。修改后的元数据会显示在文件属性中。





━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

6908128d0f429.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



14. Whisper 生成字幕





支持使用Whisper AI模型批量从视频中提取文字字幕。支持多种模型选择(tiny/base/small/medium/large),平衡速度和精度。支持多语言识别(中文简体/繁体、英文、日语、韩语、法语、德语、西班牙语等),支持自动检测语言。支持字幕翻译功能,可将识别结果翻译成其他语言。支持多种字幕格式输出(SRT/ASS/VTT),自动命名规则:[原文件名]_[语言代码].格式。程序会自动检测Whisper路径和模型文件(系统安装或Plugin/whisper目录)。





━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

69081291ad311.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



15. 声音克隆模型





程序内置了RTVC和SoVITS两个声音克隆模型,支持音频训练并生成克隆音频。RTVC支持实时语音转换和文本转语音(目前仅支持英文),需要输入文本和目标参考音频。SoVITS支持高质量音频克隆和多语言支持,需要输入源音频和目标参考音频,自动识别配置文件中的说话人列表。程序会自动检测模型完整性和Python环境。



━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

69081291dac06.png


━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━



69081277636a0.png




69081277e5202.png
 
后退
顶部