Nostr Web Client

推特大V同步 2w ago

#V2EX

### [分享创造] [只读]把去掉视觉信息也不影响其内容的视频转换为文字

## 灵感

[逆流 —— 在 AI 加持的信息过载时代进行自媒体探索](https://sspai.com/post/97105)

> 原本只需要瞥一眼就能获得的信息，现在要耗费大量时间与能量才能获得；彼此毫不相干的视觉、听觉与文字信息对感官的狂轰滥炸，在神经系统中引发了回荡不息的噪声。

> 单纯是为了获得观点，看一个 50 分钟长视频的时间，足够搜索并概览数万字论文或略读一本科普类的实体书了。

## 思考

B 站大学的确能学到知识，在看了一些科普类视频后，我又想起几个月前看的这篇文章。有一些视频，假如只听声音，也不影响其中的观点和数据，尽管他们真的花费很大力气做花哨的动画和图表。在此基础上，如果一直跟着他们声音走，就很难停下来思考，特别是口播几乎没有停顿和间歇，基本都是从开头说到结尾，“看完”了也忘完了。

还有谈话节目，就是两个人坐在那里聊天，似乎真的不需要用眼睛去看。由此想到了电影，大部分说台词的时间并不多，主要还是用眼睛去看，有一些停顿来营造情绪和气氛。如果一部电影从头说到尾，那大概就是几万字详解 xx 电影了。

## 做一个小玩具

我把赛博食录的视频链接用[爬虫(稍作修改)](https://github.com/VincentCassano/bilibili-crawler)，然后用 yt-dlp 下载分离出音频，最后用 openai-whsiper 转写成文字。虽然有些错误和标点加不上，但是整体不影响阅读。

用 ai 写了一个简单的页面，暂时只放了几个，目前还很粗糙。

<https://keiwo.github.io/readonly/>

如果有大家想"读”视频，可以发他们的名字，我抽空会添加进来。

Reply to this note

Discussion