Replying to Avatar 偶像派作手

我每天早上的通勤时间大约二十到三十分钟,这段时间同样需要摄取信息以充分利用,但只能用听的,因为双手握着方向盘。

我的习惯是播放油管上的长视频,只用耳朵接收,因为一些信息和知识类视频也只需要听,而中文知识性强且能畅所欲言无需自我审查的内容一般只有在油管上才有,对中文语言资源的贡献很大。不过,这里面的信息通常封装在视频

这个载体中,因此,检索引擎无法抓取它们。

在这种情況下,谷歌在中文语料方面应该有优势。谷歌有着先进的技术,即使是识别BGM版权问题也是轻而易举的事情。

他们的数据库应该包含了从视频中提取的文本信息(不然怎么给人打黄标)。

相比微软,谷歌的中文语料库更加丰富,不知道他们是否正在憋大招。

在谷歌的大招放出来之前,我计划开始下载我经常收听的几个 youtuber视频的音轨并将它们转化为文宇,这些博主在长年累月的输出中积累了非常宝贵的历史、时政、财经、法学等领域的知识,一旦我将这些文字丢给 OpenAl ChatGPT进行学习,它就真的成为我的“教授”了,而且几乎是免费的。

过往我的做法是在电子书里检索,那需要记住一些关键词,但现在我几乎可以用自然语言提出相关问题,然后让它回答我并告诉我出处。

我发现这软件似乎已经可以实现了,这为我建立这样一个AI大学开辟了新的可能性,开干了。

我刚安装试了一下,一段4分钟的医学科普视频不到一分钟就转成了文本,可以导出text、srt、csv格式

#[0]

Reply to this note

Please Login to reply.

Discussion

No replies yet.