自己做了一个 YouTube 视频摘要 Skill
网上做 YouTube 视频摘要的 Skill 不少,但没一个用着顺手。刚好 Claude Code 在手,自己撸一个也不算难,就动手了。严谨点说不是自己撸的,是我指挥 Claude Code 撸的——以后我做的几乎所有东西估计都得这么说了。
为什么要自己做一个
我在 YouTube 上订阅了很多频道,Podcast、Vlog、教程、科普、测评各种各样都有,现在每天更新的视频都看不过来了。毕竟人一天只有 24 小时,留给 YouTube 的时间很有限,于是就想让 AI 先帮我筛一道。
刚开始试了几个现成的 Skill,效果一般般,而且不管什么视频类型做出来的摘要形式都一样,这不是我想要的。
我对视频摘要有几点需求: - 不同的视频类型有不同的摘要方法,如访谈类、教程类、评论类,这些提炼核心内容的方法都不一样。 - 长视频不能一口气做摘要,要切段做。 - 能知道每个时间段视频在说什么,方便我跳到指定片段,比如 15:00-18:00 作者在聊 Claude Code 的使用技巧。 - 这个视频值不值得看,给出理由。
怎么做的
流程其实不复杂。
先写了个 Python 脚本去 YouTube 拉字幕,字幕以 JSON 形式落盘到本地,下次再处理同一个视频就直接用本地的,不重复拉。
然后要判断视频长短。小于 30 分钟的就整段做摘要;大于的就切段处理,每段 10 分钟,段与段之间留 1 分钟重叠,防止话题在边界被切断。
最后才是做摘要本身。短视频一把梭,长视频先逐段摘要、每段保存成独立文件,再读所有段摘要合并成最终的结构化摘要。
摘要的提示词里专门让模型先判断视频类型(访谈、教程、Vlog、评论、评测、演讲),再根据类型选择不同的组织方式。访谈类就按话题列各方观点、标争议点和金句;教程类就列教学目标、前置知识、关键步骤;Vlog 就按时间线梳理关键事件。
最终输出的格式大致长这样: - 基本信息(视频类型、主题领域、字幕来源、时长) - 一句话总结 - 关键要点(5-10 条) - 内容时间线(长视频才有,标注每段的起止时间和话题) - 详细内容(按视频类型组织) - 值得观看吗?(给出要看或可以跳过的理由)
最后那个「值得观看吗」是我自己最在意的一块,毕竟做这个 Skill 的初衷就是想让 AI 帮我做筛选。
在哪里用、怎么用
这个 Skill 我已经开源在: https://github.com/huanjuedadehen/skills
由于这个 Skill 做的事情场景固定,我并没有设计成 Agent 自动加载的方式,需显式调用。
用法很简单,安装后在你任何支持 Skill 的 Agent 里调用就可以,敲 /youtube-summarizer 再贴上 YouTube 链接就行:
/youtube-summarizer https://www.youtube.com/watch?v=xxxxx
也可以一次扔好几个链接进去批量处理,它会挨个跑完然后报告进度。
实际跑一个看看
前段时间 Lex Fridman 对黄仁勋做了一个深度访谈,长达近两个半小时。下面就是我通过这个 Skill 得到的结果:
两个半小时的视频,我花几分钟扫一眼摘要就能判断出哪些段落是我最感兴趣的,然后直接跳到对应时间点去看。Skill 最后给出的结论是:
强烈推荐观看。这是一次极为深入的对话,不仅覆盖了 NVIDIA 的技术战略(极端协同设计、CUDA 决策、硬件预判、供应链管理),更难得的是 Jensen 毫不保留地分享了他的决策哲学、领导力方法、应对压力的方式和人生观。尤其适合对 AI 基础设施、半导体行业、企业管理和领导力感兴趣的观众。Jensen 的"光速"方法论、"塑造信念体系"的领导力实践、以及对智能与人性的区分,都是极具启发性的思考框架。
跟我自己看完之后的感受基本一致。
最后
做这个 Skill 其实也没花多长时间,大部分工作就是跟 Claude Code 聊需求、看它写出来的东西、提意见让它改。真正需要自己动手的地方很少。
这大概就是现在的节奏:你不再需要先会写代码才能有一个属于自己的工具,你只要知道自己想要什么,再把这件事说清楚就够了。