视频内容处理工具分享之 VideoLingo
VideoLingo 是目前处理视频技术内容最强的开源工具之一。它的核心优势在于不仅仅是“语音转文字”,它还会利用 AI(如 DeepSeek 或 GPT)对内容进行 NLP 断句(让文字像书一样好读)并生成总结。
一、安装方式:
1. 最简单“一键整合包”(适合 Windows 用户)
如果你不想折腾 Python 环境,可以寻找社区维护的一键整合包(如 GitHub 上的 VideoLingo-OneClick 项目)。
下载:从网盘或 GitHub Releases 下载解压包。
启动:双击
启动软件.exe或一键启动.bat。配置:它会弹出一个网页界面。在左侧填入你的 LLM API Key(支持 DeepSeek、OpenAI 等,技术总结必须用到大模型)。
2. 标准安装
如果你想体验最新功能,建议通过源码安装:
1. 准备环境
安装 Python 3.10(必须是这个版本)。
安装 FFmpeg(参考上一个回答)。
如果你有 NVIDIA 显卡,建议安装 CUDA Toolkit 12.6 以获得加速。
2. 源码下载与安装 在终端(Terminal/CMD)中执行:
# 1. 克隆项目
git clone https://github.com/Huanshere/VideoLingo.git
cd VideoLingo
# 2. 安装依赖(需要 python=3.10 建议使用 conda)
conda create -n videolingo python=3.10.0 -y
conda activate videolingo
# 3. 运行安装脚本
python install.py
3. 启动应用
streamlit run st.py
3. docker安装
# 拉取镜像
docker pull rqlove/videolingo:latest
# 启动容器(CPU 模式 去掉--gpus all)
docker run -d -p 8501:8501 --name videolingo rqlove/videolingo:latest
在浏览器输入 http://localhost:8501
二、如何使用
启动后,在浏览器打开的界面中按以下步骤操作:
输入视频链接:将抖音视频链接粘入(VideoLingo 内置了下载逻辑)。
配置大模型:
- 在侧边栏设置你的 API Key。
开始执行:点击“开始处理”。它会经历:音频提取 -> Whisper 识别 -> AI 字幕切割 -> AI 文档总结。
导出 Markdown:
- 处理完成后,VideoLingo 会在 output 文件夹下生成多个文件。
- 你会找到一个名为 final_summary.md 或在网页界面直接看到 “Export Markdown” 的按钮。
提示:可以在 VideoLingo 的“自定义术语” (custom_terms.xlsx) 里加上一些技术名词,这样 AI 总结时不会出错。
三、其他
1. python版本?
查看版本
```bash
python3 --version
```
管理多版本(强烈建议):
如果你的版本不是 3.10,不要直接删掉系统自带的 Python。建议安装 Conda(推荐 Miniconda)来创建独立环境,这是 macOS 处理 Python 冲突最稳妥的方法。
- 安装 Miniconda(如果没装):前往 Miniconda 官网 下载 macOS 版并安装。如:
# Apple Silicon (M1, M2, M3, M4 芯片) curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.sh bash Miniconda3-latest-MacOSX-arm64.sh # Intel 芯片 curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-x86_64.sh bash Miniconda3-latest-MacOSX-x86_64.sh
- 按 Enter 查看协议,一直按空格翻到底。
- 输入
yes同意协议。 - 按 Enter 确认默认安装路径。
- 关键一步:当询问是否运行
conda init时,输入yes。这会自动帮你配置好终端环境。 - conda –version 验证
- 创建 3.10 环境:
conda create -n videolingo python=3.10.0 -y # 执行上面的bash,这里可能会输出接受服务条款,输入提示的命令即可 conda activate videolingo