#V2EX
### [分享创造] [只读]把去掉视觉信息也不影响其内容的视频转换为文字
## 灵感
[逆流 —— 在 AI 加持的信息过载时代进行自媒体探索](https://sspai.com/post/97105)
> 原本只需要瞥一眼就能获得的信息,现在要耗费大量时间与能量才能获得;彼此毫不相干的视觉、听觉与文字信息对感官的狂轰滥炸,在神经系统中引发了回荡不息的噪声。
> 单纯是为了获得观点,看一个 50 分钟长视频的时间,足够搜索并概览数万字论文或略读一本科普类的实体书了。
## 思考
B 站大学的确能学到知识,在看了一些科普类视频后,我又想起几个月前看的这篇文章。有一些视频,假如只听声音,也不影响其中的观点和数据,尽管他们真的花费很大力气做花哨的动画和图表。在此基础上,如果一直跟着他们声音走,就很难停下来思考,特别是口播几乎没有停顿和间歇,基本都是从开头说到结尾,“看完”了也忘完了。
还有谈话节目,就是两个人坐在那里聊天,似乎真的不需要用眼睛去看。由此想到了电影,大部分说台词的时间并不多,主要还是用眼睛去看,有一些停顿来营造情绪和气氛。如果一部电影从头说到尾,那大概就是几万字详解 xx 电影了。
## 做一个小玩具
我把赛博食录的视频链接用[爬虫(稍作修改)](https://github.com/VincentCassano/bilibili-crawler),然后用 yt-dlp 下载分离出音频,最后用 openai-whsiper 转写成文字。虽然有些错误和标点加不上,但是整体不影响阅读。
用 ai 写了一个简单的页面,暂时只放了几个,目前还很粗糙。
<https://keiwo.github.io/readonly/>
如果有大家想"读”视频,可以发他们的名字,我抽空会添加进来。