Profile: dc78ed61...

今天准备一个面对大学生的AI分享PPT,朋友希望教会大家用coze搭建一个学习辅助相关的agent,然后发布到豆包。

第二个任务是用豆包写歌词,海绵音乐作曲,即梦生成视频片段,做一个音乐MV。

如果感兴趣,我这两周写个详细教程出来。

callannie 做了游戏化英语学习,有虚拟人即时反馈鼓励讲解,比干练习有趣多了。 https://t.co/88YAJkwiA8 https://video.twimg.com/amplify_video/1843925813911269378/vid/avc1/720x1560/TvfkNhTL4f7EtHMF.mp4?tag=16

人工智能发展史的一些关键里程碑:

1943年:沃伦·麦卡洛克(Warren McCulloch)和沃尔特·皮茨(Walter Pitts)提出了人工神经元模型,这是神经网络研究的基础。

1950年:图灵发表了《计算机器与智能》,提出了著名的“图灵测试”,即如果一台机器能在对话中让人类无法判断其是否为机器,则这台机器具有智能。标志着人工智能概念的萌芽。

1956年:在美国达特茅斯学院,由约翰·麦卡锡(John McCarthy)、马文·明斯基(Marvin Minsky)等人组织的会议上,首次提出了“人工智能(Artificial Intelligence)”的概念。这次会议被认为是人工智能作为一门独立学科的正式诞生。

1959年:亚瑟·塞缪尔(Arthur Samuel)开发了世界上第一个自学习程序——西洋跳棋程序,引入了"机器学习"这个术语。

1966年:约瑟夫·魏岑鲍姆(Joseph Weizenbaum)开发了ELIZA,这是一个早期的自然语言处理程序,能够模拟心理治疗师与人对话,揭示了机器与人类自然语言交流的可能性。

1969年:马文·明斯基(Marvin Minsky)和西摩·帕珀特(Seymour Papert)出版《感知器》一书,指出了单层神经网络的局限性,导致神经网络研究一度停滞。

1982年:约翰·霍普菲尔德(John Hopfield)提出霍普菲尔德网络,重新激发了对神经网络的研究兴趣。

1986年:大卫·鲁梅尔哈特(David Rumelhart)等人重新引入了反向传播算法,推动了多层神经网络的研究。

1989年:杨立昆(Yann LeCun)应用卷积神经网络于手写字符识别,这是深度学习在实际应用中的早期成功案例。

1997年:IBM的超级计算机深蓝(Deep Blue)击败了国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov),标志着AI在博弈领域的重大突破。

2006年:杰弗里·辛顿(Geoffrey Hinton)等人提出了深度信念网络(Deep Belief Networks),为深度学习奠定了基础。

2011年:IBM的Watson系统在美国的智力问答节目《Jeopardy!(危险边缘)》中战胜人类冠军,展示了自然语言处理和知识检索的强大能力。

2011年:苹果公司在iPhone 4S中引入了Siri,这是第一个广泛使用的智能个人助理。

2012年:杰弗里·辛顿的指导下,亚历克斯·克里泽夫斯基(Alex Krizhevsky)开发出AlexNet模型,在ImageNet图像识别竞赛中取得了显著的成绩,推动了深度卷积神经网络的发展。

2014年:伊恩·古德费罗(Ian Goodfellow)提出了生成式对抗网络(GAN),为生成模型开辟了新方向。

2016年:谷歌DeepMind的AlphaGo以4比1战胜围棋世界冠军李世石,这是人工智能在复杂游戏中的里程碑事件。

2017年:论文《Attention Is All You Need》提出了Transformer架构,革新了自然语言处理模型的设计,为后续的预训练语言模型奠定了基础。

2018年:谷歌发布了BERT(Bidirectional Encoder Representations from Transformers),这是NLP领域的一个重要突破,为后续的语言模型发展奠定了基础。

2019年:OpenAI发布了GPT-2,展示了大规模预训练模型在文本生成上的强大能力。

2020年:DeepMind的AlphaFold在蛋白质结构预测中取得重大突破,对生物学和医学研究具有深远影响。

2020年:OpenAI发布了GPT-3,拥有1750亿参数,进一步提升了语言生成和理解的能力。

2021年:OpenAI发布了DALL·E,可以根据文本描述生成图像,同时发布了CLIP,加强了图像与文本的联合理解。

2022年:Stable Diffusion和Midjourney等AI图像生成模型的公开发布,使得AI艺术创作变得更加普及。

2022年:OpenAI基于GPT-3.5架构,训练了对话模型ChatGPT,能够进行连贯的对话和回答问题,在全球范围内引起广泛关注。

2023年:OpenAI发布了GPT-4,具备多模态处理能力和更强的理解与生成性能,进一步推进了通用人工智能的发展。

...

海绵音乐+李煜《虞美人·春花秋月何时了》生成5种音乐风格。

歌词支持结构控制,可以配合Claude 写歌词,Prompt如下

---

你是AI音乐编曲大师,我提供一段歌词,然后参考下面结构重新编排:

示例

## 原始歌词:

记得那一天 那一天我们相恋

说好彼此都不说再见

遵守诺言 用心去相恋

我为你撑伞 你为我取暖

当我把心交给你的那一天

你却消失在我的眼前

事到如今已经过了好多年

是否你还像从前

## 编排后歌词:

(前奏)

(主歌)

记得那一天 那一天我们相恋

说好彼此都不说再见

遵守诺言 用心去相恋

我为你撑伞 你为我取暖

(间奏)

(副歌)

当我把心交给你的那一天

你却消失在我的眼前

事到如今已经过了好多年

是否你还像从前

(尾奏)

### 歌曲结构可用标签:

• 前奏:Intro,歌曲开始的音乐部分,主要用于引导歌曲的整体氛围。

• 主歌:Verse,通常在前奏之后,歌曲中叙述歌曲故事或主题的部分。

• 副歌:Chorus,一般在主歌之后,旋律有记忆点和感染力,是整首歌的高潮,进一步强化歌曲的主题和情感。

• 间奏:Inst,歌曲中的纯音乐段落,用于连接不同的演唱部分。

• 尾奏:Outro,歌曲结束后的音乐段落,用于营造歌曲结束的氛围。

• 桥段:Bridge,通常出现在歌曲中段或接近结尾处,是一个过渡部分,用于连接不同的歌曲段落。

---

下面是第一首歌词:

春花秋月何时了?

往事知多少。

小楼昨夜又东风

故国不堪回首月明中

雕栏玉砌应犹在,只是朱颜改。

问君能有几多愁?

恰似一江春水向东流。 https://video.twimg.com/ext_tw_video/1843672722855124992/pu/vid/avc1/1280x720/ZNNyNRtoSI1Me3tP.mp4?tag=12

查了下上门板的意思:

部队借老百姓的门板作床板,因各家门板尺寸不同,高矮大小不一,一大堆门板如果弄混了就对不上榫,难以安装回去。

所以规定用完门板要装回去。

很具体,很接地气.. https://t.co/FS9rzTyLb4

那个年代就有穷游概念了 哈哈哈 https://t.co/0AjLA7hjtH

Buzzabout是一款用户需求洞察工具,免费版本支持Reddit,付费版本支持TikTok和Youtube的用户数据分析。

https://t.co/FOJQ8RcDQt

不用翻Reddit评论,输入关键词,就能大概用户痛点和关注点,还能AI Chat深挖。

这对PM、独立开发者和海外营销推广很有帮助。

产品设计也很聪明,有多步进度条和等待Tips,避免结果生成太慢,给用户掌控感。

比如搜索“English Learning Tools”,从结果看,大部分人对AI教育应用感兴趣,持正面乐观情绪,而且很重视发音准确性。

个性化学习和游戏化学习,参与讨论的人多,但情绪负向,这可能是痛点?

豆包机器人已上架:https://t.co/iS8DE85A8n

使用方法,输入任何词汇或场景,自动生成图片和TTS音频,下载后可以用剪映合成视频。

Coze上没有好用的图片+音频合成视频插件,不能一步到位,略微遗憾。

不少网友建议把这个Bot变成App,感兴趣的程序员可以试试。

孩子说一个中文,我帮她生成相关单词和配图,一起跟读 哈哈哈。 https://t.co/faJKSmt3dy

国庆假期到了,朋友们推荐了一些书,打算抽空翻翻:

①《大脑传》-马修·科布

② 《毛泽东传》-迪克·威尔逊

③《棋与人生》-加里·卡斯帕罗夫

④ 《给青年的十二封信》-朱光潜

⑤ 《真希望我父母读过这本书》-菲利帕·佩里

又重温了纳瓦尔关于读书的看法:

① 养成每天阅读的习惯,每天坚持比一次性大量阅读更重要。

② 选择你感兴趣的书,兴趣是最好的老师,不要执着于读好书,垃圾读物也能帮你找到真正感兴趣的领域。

③ 不要害怕阅读非主流书籍,即使不同意作者观点,也有助于帮你全面理解世界。

④ 与其读所有书,不如反复阅读一百本好书。

⑤ 阅读要和写作结合,把阅读收获提炼成简单的几句话,发到社交媒体跟人交流。

前几天败家的海钓装备到货:

纺车轮:禧玛诺 22款斯泰拉 2500SHG

杆子: 露娜米斯 S80M ,直柄中调2.44米

主线:禧玛诺Pitbull 12编 0.8 PE线 150米

前导线:西格之星 100 米

拟饵:店家送的铁板,前面一个单钩,后面一个三本钩带羽毛,做工不错。

在抖音搜索教程学习完成了轮子上线和绑前导线,耗时大约40分。

迫不及待开车到顺义高丽营星海钓场,真·试水。

为什么选这家钓场?一方面近,另一方面高德地图评分相对高,且还有付费教学。

花钱请老师是新手上路最快的方式,虽然以前玩微物,但对于重型远投装备,让有经验的人指导,一定比自己瞎折腾更少走弯路。

老板人不错,花了大概10分钟讲了下抛投技巧和控饵手法,一分钱没收,然后就让我开始实战。

经过练习,7克铁板抛投距离到 50米左右,一共钓到 6 条大口鲈鱼,尝试了好几种拟饵:铁板中鱼最多,然后是亮片,VIB和铅头钩T尾没钓上来。

亮片咬口最清晰,duang的一下,很刺激过瘾。

期待国庆假期天津海钓实战,目标:中一条鱼。

下午重温了新开服的暴雪卡片游戏《炉石传说》,一晃10年过去了。

充值128,分解了一张金色传说卡牌,配了个自残术牌组。

可惜,网易服务器没搞好,登录要排队15-20分钟,进去打一局必掉线,然后又要排队15分钟...

折腾了三回,热情都被磨光了...

打开两个Notebooklm浏览器tab,扩展屏分屏展示,一个看阅读摘要,一个对话提问。

主屏heptabase记笔记,raycast AI随时唤起查背景知识,相当完美。 https://t.co/D12FRhuBAG

Tim ferris访谈畅销书作家伊丽莎白,她提到一个“双向祈祷”很有趣。

她三十岁时第一次离婚,非常绝望,人生处于低谷,为了让自己恢复,她开始尝试用朋友或亲人的口吻给自己写信,写下最希望别人对她说的话。

练习方法:

1. 找个安静的地方:随着练习时间变长,可以在任何地方进行。

2. 读些让你感到神圣的东西,有助于打开心扉。 比如哈菲兹、鲁米、玛丽·奥利弗或沃尔特·惠特曼的诗歌。

3. 只问一个问题。例如“亲爱的,你今天想让我知道什么?” 避免对话,因为这会让你的自我意识参与进来。

4. 第一行回复以一种爱称开始,例如“亲爱的”、“我的孩子”、“我的宝贝”。 伊丽莎白经常听到“我的小宝贝”这个称呼。

5. 写下你希望别人对你说的话,因为你知道自己渴望什么样的爱。

“双向祈祷”源于一个古老的精神练习,在12步戒瘾疗法中也非常常见。

避免问“为什么”这类问题(往往没有答案),多问一些以“如何”开头的、指向具体行动的问题。例如“你希望我如何度过这段时间?”

好奇,Mac上的类Spotlight效率工具,如果迁移到iOS会是什么产品形态,能解决什么问题?

前几天还想有没有社交媒体聚合发布工具,今天刷到一个Chrome插件叫“爱贝壳内容同步助手”,支持同步发动态、文章、短视频到多个平台。

免费版能发3条,付费版不限制,一年只需要60块,开发者定价很良心。

https://t.co/LCcptmicYT https://t.co/vALDBS6pRR

我认为大多数最好的生活基于创造的冲动,而大多数最糟糕的生活源于对占有的热爱。 --罗素 https://t.co/wZvr9Kbfjg https://video.twimg.com/ext_tw_video/1839632787986604032/pu/vid/avc1/480x854/avGKf-HVVErOqWUX.mp4?tag=12

一步到位,直接上好装备,免得以后心痒痒升级花更多钱。(为败家找借口 😁) https://t.co/IQJElqrdQg

终于读完《智人之上》,把epub转成pdf,传到Notebooklm对话总结。

Epub转PDF:https://t.co/tJ6Wyn9it2

NotebookLM:https://t.co/LF0cN1MmPE

天真的信息观

天真的信息观认为,信息的主要作用是呈现现实、揭示真相。

只要我们不断收集更多信息,并进行准确分析,就能更接近真理。但实际上,大多数信息并非为了追求真理,而是为了建立和维持社会秩序,这常常需要牺牲部分真相,例如:

① 官僚制度通过文件、档案、表格等形式,将信息标准化和分类,提高了社会运作效率,但也可能导致僵化和扭曲,忽视现实的复杂性。

② 神话故事通过构建共同的信念和价值观,将人们团结在一起,但也可能被用来掩盖真相,甚至成为权力滥用的工具。

印刷术和信息网络失控

印刷术的出现,使得宗教经典能够大规模复制和传播,打破了教会对知识的垄断,促进了个人主义和理性主义的兴起。同时,印刷术也促进了标准化语言的形成,有利于民族意识的形成和民族国家的建立。

然而,印刷术带来的信息爆炸也对传统的社会秩序构成挑战。例如,猎巫行动的兴起,部分原因就是印刷术的普及,使得关于巫术的书籍和谣言大量传播,加剧了社会恐慌和对异端的迫害。

民粹主义的危害

民粹主义者往往声称自己代表人民,将"人民的权力"绝对化,无视人民内部的多元性和利益差异。

他们不信任任何独立于"人民意志"之外的权威机构,包括法院、媒体和学术机构,认为这些机构是"精英阶层"的工具。

民粹主义者会试图削弱或控制这些机构,以消除对自身权力的制约。

然而,这些独立机构正是民主制度中重要的自我修正机制,能够有效地监督权力、揭露真相和纠正错误。一旦这些机制遭到破坏,民主制度就很容易滑向独裁。

算法可能产生偏见

人工智能算法的学习依赖于训练数据,而这些数据本身就可能包含人类社会的偏见。

如果用于训练招聘算法的数据集中,男性员工的比例远高于女性员工,那么算法就可能学会偏向男性,在招聘过程中给予男性更高的评分。

算法的学习需要一个明确的目标。然而,目标的设定本身就可能带有主观性和偏见。

另外,算法的决策过程往往缺乏透明度,难以被人类理解和监督,这使得算法的偏见难以被发现和纠正,缺乏自我修正机制。

人工智能伦理难题

康德义务论的核心观点是道德行为应该遵循普遍适用的理性原则,但在实践中却常常遇到困难。

这是因为在现实生活中,人们往往会根据身份认同来区分"自己人"和"外人",并对不同群体区别对待。

假设一台遵守康德"普世规则"、并且想要继续存在的计算机,可能会认为"消灭人类"是一种可以接受的行为。

因为"消灭人类"并不会威胁到作为非生物体的计算机自身的安全,因此这条规则在逻辑上是"普世的"。

计算机不具有生物体对死亡的恐惧,因此它可能无法理解人类对生命的珍视。

即使计算机能够理解和应用康德的义务论,它也可能得出"人类的生命不值得保护"的结论。

所以,依靠抽象的理性原则来构建人工智能伦理框架是远远不够的,需要考虑到人工智能的非生物特性、以及其与人类社会之间复杂的互动关系。

关于功利主义

功利主义认为,能够最大化快乐、最小化痛苦的行为才是道德的行为。

在实际应用中,功利主义面临着如何量化快乐和痛苦的难题。

以“痛苦值”和“快乐值”为例,在复杂的历史情境中,很难准确计算某个行为对世界整体快乐和痛苦总和的影响。

当某个行为带来的痛苦或快乐的结果非常明显时,功利主义可以提供清晰的道德判断。

以纳粹大屠杀为例,大屠杀给犹太人带来了巨大的痛苦,而对其他人(包括德国人)并没有带来相应的利益,因此从功利主义的角度来看,大屠杀是绝对不道德的。

以同性恋为例,对同性恋的迫害给当事人带来了巨大的痛苦,而这种迫害的理由往往是基于偏见和没有实证依据的道德准则,因此从功利主义的角度来看,对同性恋的迫害也是不合理的。

但是,当面对一些难以量化的痛苦或快乐时,例如对死亡的恐惧、对抽象概念的理解等,功利主义难以做出准确的判断。

当不同的道德原则发生冲突时,例如为了保护人权是否可以发动战争,功利主义也难以提供明确的指导。

作者对人工智能时代信息网络的看法

① 信息网络的本质并非在于呈现真相,而是在于联结和维持秩序。

② 从部落社会到现代社会,信息网络的演变伴随着权力的转移。掌握信息网络关键节点的群体或个体将获得更大的权力。

③ 人工智能的出现将催生新的信息网络形态,其影响力远超印刷术或工业革命。

④ 以往的技术革命,例如印刷术革命、工业革命,本质上都是为人类提供了新的工具和手段,而人工智能革命则将非人类智能体(即人工智能)引入信息网络,使其成为主动的参与者和决策者。

⑤ 人工智能是人类历史上第一个能够自行做出决策并产生想法的技术,其潜在风险远超以往任何技术革命。

信息网络史

史前时代 - 公元前1000年:

① 人类生活以小型狩猎采集游群为主,信息网络分布式,口口相传,民主决策。

② 随着农业发展和社会规模扩大,出现中央集权的官僚体系,信息网络从人际网络转变为人与文件互动,信息检索成为难题。

③ 神话故事成为维系社会秩序的重要工具,但也可能掩盖真相。

公元前1000年 - 公元1500年:

① 犹太教利用“书”这项新技术,试图绕过人类中介,直接传播神的旨意,并通过大量复制宗教经典来维护文本权威,限制权力滥用。

② 基督教兴起,教会机构在整理、诠释宗教经典的过程中,获得了巨大的权力。

③ 印刷术发明之前,信息传播受限,大规模极权政权难以出现。

公元1500年 - 1900年:

① 印刷术推动信息传播,促进科学革命和启蒙运动,但也为极权主义兴起提供了技术基础。

② 现代官僚制度形成,依赖清单列表和数据管理,与神话故事共同塑造社会秩序。

20世纪:

① 电报、无线电等现代信息技术出现,信息传播速度和范围大幅提升,极权政权得以监控和控制人民生活。

② 冷战时期,民主与极权两种信息网络模式形成鲜明对比。

21世纪:

① 互联网和人工智能兴起,人类进入以算法为基础的新型信息网络。

② 算法在带来便利的同时,也引发了一系列问题,如算法偏见、信息茧房、民主制度受到威胁等。

好几个朋友问智人之上这本书如何,刚读到一半,简单说说。

很多人说不如人类简史和未来简史,但我觉得不错,观点新颖,推演也有一定逻辑。

比如用信息网络特征来解读独裁和民主,宗教和AI。

斯大林时期的苏联,中世纪的猎巫行动,这种类荒诞和恐怖,是如何不可避免的发生,未来再次出现的风险。

原本出于流量目的信息传播算法,不自觉的贴合人性,走向宣扬仇恨和民粹,加剧社会的撕裂。

作者担心AI强大后,极权主义可能会上升到新高度,提前敲响警钟。

为了铺垫论证,宗教,政治内容讲的有点多,相比之前的书,读起来有点累。

总之,仍是一本值得读的书,甚至有朋友感慨,这居然能在国内出版?真不容易。