自己做了一个 YouTube 视频摘要 Skill

2026-05-25 10:13
YouTube 视频摘要 AI Skill Claude Code 字幕提取 长视频分段 视频类型识别
摘要:一个开源的 YouTube 视频摘要 Skill,专为订阅频道多、视频看不完的观众设计。支持按视频类型(访谈、教程、Vlog、评论等)生成差异化摘要,长视频自动切段处理并标注时间线,还能给出「值不值得看」的筛选建议。

网上做 YouTube 视频摘要的 Skill 不少,但没一个用着顺手。刚好 Claude Code 在手,自己撸一个也不算难,就动手了。严谨点说不是自己撸的,是我指挥 Claude Code 撸的——以后我做的几乎所有东西估计都得这么说了。

为什么要自己做一个

我在 YouTube 上订阅了很多频道,Podcast、Vlog、教程、科普、测评各种各样都有,现在每天更新的视频都看不过来了。毕竟人一天只有 24 小时,留给 YouTube 的时间很有限,于是就想让 AI 先帮我筛一道。

刚开始试了几个现成的 Skill,效果一般般,而且不管什么视频类型做出来的摘要形式都一样,这不是我想要的。

我对视频摘要有几点需求: - 不同的视频类型有不同的摘要方法,如访谈类、教程类、评论类,这些提炼核心内容的方法都不一样。 - 长视频不能一口气做摘要,要切段做。 - 能知道每个时间段视频在说什么,方便我跳到指定片段,比如 15:00-18:00 作者在聊 Claude Code 的使用技巧。 - 这个视频值不值得看,给出理由。

怎么做的

流程其实不复杂。

先写了个 Python 脚本去 YouTube 拉字幕,字幕以 JSON 形式落盘到本地,下次再处理同一个视频就直接用本地的,不重复拉。

然后要判断视频长短。小于 30 分钟的就整段做摘要;大于的就切段处理,每段 10 分钟,段与段之间留 1 分钟重叠,防止话题在边界被切断。

最后才是做摘要本身。短视频一把梭,长视频先逐段摘要、每段保存成独立文件,再读所有段摘要合并成最终的结构化摘要。

摘要的提示词里专门让模型先判断视频类型(访谈、教程、Vlog、评论、评测、演讲),再根据类型选择不同的组织方式。访谈类就按话题列各方观点、标争议点和金句;教程类就列教学目标、前置知识、关键步骤;Vlog 就按时间线梳理关键事件。

最终输出的格式大致长这样: - 基本信息(视频类型、主题领域、字幕来源、时长) - 一句话总结 - 关键要点(5-10 条) - 内容时间线(长视频才有,标注每段的起止时间和话题) - 详细内容(按视频类型组织) - 值得观看吗?(给出要看或可以跳过的理由)

最后那个「值得观看吗」是我自己最在意的一块,毕竟做这个 Skill 的初衷就是想让 AI 帮我做筛选。

在哪里用、怎么用

这个 Skill 我已经开源在: https://github.com/huanjuedadehen/skills

由于这个 Skill 做的事情场景固定,我并没有设计成 Agent 自动加载的方式,需显式调用。

用法很简单,安装后在你任何支持 Skill 的 Agent 里调用就可以,敲 /youtube-summarizer 再贴上 YouTube 链接就行:

/youtube-summarizer https://www.youtube.com/watch?v=xxxxx

也可以一次扔好几个链接进去批量处理,它会挨个跑完然后报告进度。

Skill 的使用

实际跑一个看看

前段时间 Lex Fridman 对黄仁勋做了一个深度访谈,长达近两个半小时。下面就是我通过这个 Skill 得到的结果:

关键要点

内容时间线

值得看吗

两个半小时的视频,我花几分钟扫一眼摘要就能判断出哪些段落是我最感兴趣的,然后直接跳到对应时间点去看。Skill 最后给出的结论是:

强烈推荐观看。这是一次极为深入的对话,不仅覆盖了 NVIDIA 的技术战略(极端协同设计、CUDA 决策、硬件预判、供应链管理),更难得的是 Jensen 毫不保留地分享了他的决策哲学、领导力方法、应对压力的方式和人生观。尤其适合对 AI 基础设施、半导体行业、企业管理和领导力感兴趣的观众。Jensen 的"光速"方法论、"塑造信念体系"的领导力实践、以及对智能与人性的区分,都是极具启发性的思考框架。

跟我自己看完之后的感受基本一致。

最后

做这个 Skill 其实也没花多长时间,大部分工作就是跟 Claude Code 聊需求、看它写出来的东西、提意见让它改。真正需要自己动手的地方很少。

这大概就是现在的节奏:你不再需要先会写代码才能有一个属于自己的工具,你只要知道自己想要什么,再把这件事说清楚就够了。