GPT的多模态能力(文字+图片)API + 接入Boston Dynamics + 接入互联网 + 进入现实…

很难保证不会涌现出什么东西

Reply to this note

Please Login to reply.

Discussion

我几年前感觉一个程序员不为AI和自动驾驶写代码,就无处写代码了, 然后加入此行业, 当时我的博士同学对此嗤之以鼻“就是概率论”。 但是今天llm的确是夸大了其智能。 我感觉杨乐坤评价是对的“llm就是个自回归模型, AGI得走其他路” 。最新keras作者也表示“llm就是个连续可导的数据库”。 多模态出现在gpt3.5之前, 是transformer 的 embedding优秀的结果。

当然openai这一波(llm transform)这一波能力展示, 对以往的视觉、机器人、自动驾驶等等都有极大技术提高。 可是我个人认为, AI 还没有任何有意识的迹象, 一个如同乌鸦大脑一样的有意识的智能机器, 还造不出来

我想了一下,你说的这个是一个很古老的关于“中文房间”的隐喻,但我觉得这个隐喻多多少少有点过时了。

我不知道我举一个例子对不对,这个例子就是,你在生活中还有网上能遇到很多人,这些人他们自己说话都不明白自己在说什么,他们甚至比GPT更低能。

如果一个东西无法理解自己在说什么却又一直在说话,这是一种对于机器没有意识的辩护或者理由,那么这些人,却又很明显是有意识的,这就陷入一个paradox了

你说的很有意思, 我受益匪浅,会搜索深度的学习一下。 我是不知道“中文房间” 这个隐喻的, 但是前几天我也想到一个电影《猫鼠游戏》,里面的小李子能言会道的冒充各种专家, 也像是个llm附身的骗子~