Profile: dc78ed61...
今天准备一个面对大学生的AI分享PPT,朋友希望教会大家用coze搭建一个学习辅助相关的agent,然后发布到豆包。
第二个任务是用豆包写歌词,海绵音乐作曲,即梦生成视频片段,做一个音乐MV。
如果感兴趣,我这两周写个详细教程出来。
callannie 做了游戏化英语学习,有虚拟人即时反馈鼓励讲解,比干练习有趣多了。 https://t.co/88YAJkwiA8
https://video.twimg.com/amplify_video/1843925813911269378/vid/avc1/720x1560/TvfkNhTL4f7EtHMF.mp4?tag=16
人工智能发展史的一些关键里程碑:
1943年:沃伦·麦卡洛克(Warren McCulloch)和沃尔特·皮茨(Walter Pitts)提出了人工神经元模型,这是神经网络研究的基础。
1950年:图灵发表了《计算机器与智能》,提出了著名的“图灵测试”,即如果一台机器能在对话中让人类无法判断其是否为机器,则这台机器具有智能。标志着人工智能概念的萌芽。
1956年:在美国达特茅斯学院,由约翰·麦卡锡(John McCarthy)、马文·明斯基(Marvin Minsky)等人组织的会议上,首次提出了“人工智能(Artificial Intelligence)”的概念。这次会议被认为是人工智能作为一门独立学科的正式诞生。
1959年:亚瑟·塞缪尔(Arthur Samuel)开发了世界上第一个自学习程序——西洋跳棋程序,引入了"机器学习"这个术语。
1966年:约瑟夫·魏岑鲍姆(Joseph Weizenbaum)开发了ELIZA,这是一个早期的自然语言处理程序,能够模拟心理治疗师与人对话,揭示了机器与人类自然语言交流的可能性。
1969年:马文·明斯基(Marvin Minsky)和西摩·帕珀特(Seymour Papert)出版《感知器》一书,指出了单层神经网络的局限性,导致神经网络研究一度停滞。
1982年:约翰·霍普菲尔德(John Hopfield)提出霍普菲尔德网络,重新激发了对神经网络的研究兴趣。
1986年:大卫·鲁梅尔哈特(David Rumelhart)等人重新引入了反向传播算法,推动了多层神经网络的研究。
1989年:杨立昆(Yann LeCun)应用卷积神经网络于手写字符识别,这是深度学习在实际应用中的早期成功案例。
1997年:IBM的超级计算机深蓝(Deep Blue)击败了国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov),标志着AI在博弈领域的重大突破。
2006年:杰弗里·辛顿(Geoffrey Hinton)等人提出了深度信念网络(Deep Belief Networks),为深度学习奠定了基础。
2011年:IBM的Watson系统在美国的智力问答节目《Jeopardy!(危险边缘)》中战胜人类冠军,展示了自然语言处理和知识检索的强大能力。
2011年:苹果公司在iPhone 4S中引入了Siri,这是第一个广泛使用的智能个人助理。
2012年:杰弗里·辛顿的指导下,亚历克斯·克里泽夫斯基(Alex Krizhevsky)开发出AlexNet模型,在ImageNet图像识别竞赛中取得了显著的成绩,推动了深度卷积神经网络的发展。
2014年:伊恩·古德费罗(Ian Goodfellow)提出了生成式对抗网络(GAN),为生成模型开辟了新方向。
2016年:谷歌DeepMind的AlphaGo以4比1战胜围棋世界冠军李世石,这是人工智能在复杂游戏中的里程碑事件。
2017年:论文《Attention Is All You Need》提出了Transformer架构,革新了自然语言处理模型的设计,为后续的预训练语言模型奠定了基础。
2018年:谷歌发布了BERT(Bidirectional Encoder Representations from Transformers),这是NLP领域的一个重要突破,为后续的语言模型发展奠定了基础。
2019年:OpenAI发布了GPT-2,展示了大规模预训练模型在文本生成上的强大能力。
2020年:DeepMind的AlphaFold在蛋白质结构预测中取得重大突破,对生物学和医学研究具有深远影响。
2020年:OpenAI发布了GPT-3,拥有1750亿参数,进一步提升了语言生成和理解的能力。
2021年:OpenAI发布了DALL·E,可以根据文本描述生成图像,同时发布了CLIP,加强了图像与文本的联合理解。
2022年:Stable Diffusion和Midjourney等AI图像生成模型的公开发布,使得AI艺术创作变得更加普及。
2022年:OpenAI基于GPT-3.5架构,训练了对话模型ChatGPT,能够进行连贯的对话和回答问题,在全球范围内引起广泛关注。
2023年:OpenAI发布了GPT-4,具备多模态处理能力和更强的理解与生成性能,进一步推进了通用人工智能的发展。
...
海绵音乐+李煜《虞美人·春花秋月何时了》生成5种音乐风格。
歌词支持结构控制,可以配合Claude 写歌词,Prompt如下
---
你是AI音乐编曲大师,我提供一段歌词,然后参考下面结构重新编排:
示例
## 原始歌词:
记得那一天 那一天我们相恋
说好彼此都不说再见
遵守诺言 用心去相恋
我为你撑伞 你为我取暖
当我把心交给你的那一天
你却消失在我的眼前
事到如今已经过了好多年
是否你还像从前
## 编排后歌词:
(前奏)
(主歌)
记得那一天 那一天我们相恋
说好彼此都不说再见
遵守诺言 用心去相恋
我为你撑伞 你为我取暖
(间奏)
(副歌)
当我把心交给你的那一天
你却消失在我的眼前
事到如今已经过了好多年
是否你还像从前
(尾奏)
### 歌曲结构可用标签:
• 前奏:Intro,歌曲开始的音乐部分,主要用于引导歌曲的整体氛围。
• 主歌:Verse,通常在前奏之后,歌曲中叙述歌曲故事或主题的部分。
• 副歌:Chorus,一般在主歌之后,旋律有记忆点和感染力,是整首歌的高潮,进一步强化歌曲的主题和情感。
• 间奏:Inst,歌曲中的纯音乐段落,用于连接不同的演唱部分。
• 尾奏:Outro,歌曲结束后的音乐段落,用于营造歌曲结束的氛围。
• 桥段:Bridge,通常出现在歌曲中段或接近结尾处,是一个过渡部分,用于连接不同的歌曲段落。
---
下面是第一首歌词:
春花秋月何时了?
往事知多少。
小楼昨夜又东风
故国不堪回首月明中
雕栏玉砌应犹在,只是朱颜改。
问君能有几多愁?
查了下上门板的意思:
部队借老百姓的门板作床板,因各家门板尺寸不同,高矮大小不一,一大堆门板如果弄混了就对不上榫,难以安装回去。
所以规定用完门板要装回去。
很具体,很接地气.. https://t.co/FS9rzTyLb4 
那个年代就有穷游概念了 哈哈哈 https://t.co/0AjLA7hjtH 
Buzzabout是一款用户需求洞察工具,免费版本支持Reddit,付费版本支持TikTok和Youtube的用户数据分析。
不用翻Reddit评论,输入关键词,就能大概用户痛点和关注点,还能AI Chat深挖。
这对PM、独立开发者和海外营销推广很有帮助。
产品设计也很聪明,有多步进度条和等待Tips,避免结果生成太慢,给用户掌控感。
比如搜索“English Learning Tools”,从结果看,大部分人对AI教育应用感兴趣,持正面乐观情绪,而且很重视发音准确性。
个性化学习和游戏化学习,参与讨论的人多,但情绪负向,这可能是痛点?

豆包机器人已上架:https://t.co/iS8DE85A8n
使用方法,输入任何词汇或场景,自动生成图片和TTS音频,下载后可以用剪映合成视频。
Coze上没有好用的图片+音频合成视频插件,不能一步到位,略微遗憾。
不少网友建议把这个Bot变成App,感兴趣的程序员可以试试。
孩子说一个中文,我帮她生成相关单词和配图,一起跟读 哈哈哈。 https://t.co/faJKSmt3dy

国庆假期到了,朋友们推荐了一些书,打算抽空翻翻:
①《大脑传》-马修·科布
② 《毛泽东传》-迪克·威尔逊
③《棋与人生》-加里·卡斯帕罗夫
④ 《给青年的十二封信》-朱光潜
⑤ 《真希望我父母读过这本书》-菲利帕·佩里
又重温了纳瓦尔关于读书的看法:
① 养成每天阅读的习惯,每天坚持比一次性大量阅读更重要。
② 选择你感兴趣的书,兴趣是最好的老师,不要执着于读好书,垃圾读物也能帮你找到真正感兴趣的领域。
③ 不要害怕阅读非主流书籍,即使不同意作者观点,也有助于帮你全面理解世界。
④ 与其读所有书,不如反复阅读一百本好书。
⑤ 阅读要和写作结合,把阅读收获提炼成简单的几句话,发到社交媒体跟人交流。
前几天败家的海钓装备到货:
纺车轮:禧玛诺 22款斯泰拉 2500SHG
杆子: 露娜米斯 S80M ,直柄中调2.44米
主线:禧玛诺Pitbull 12编 0.8 PE线 150米
前导线:西格之星 100 米
拟饵:店家送的铁板,前面一个单钩,后面一个三本钩带羽毛,做工不错。
在抖音搜索教程学习完成了轮子上线和绑前导线,耗时大约40分。
迫不及待开车到顺义高丽营星海钓场,真·试水。
为什么选这家钓场?一方面近,另一方面高德地图评分相对高,且还有付费教学。
花钱请老师是新手上路最快的方式,虽然以前玩微物,但对于重型远投装备,让有经验的人指导,一定比自己瞎折腾更少走弯路。
老板人不错,花了大概10分钟讲了下抛投技巧和控饵手法,一分钱没收,然后就让我开始实战。
经过练习,7克铁板抛投距离到 50米左右,一共钓到 6 条大口鲈鱼,尝试了好几种拟饵:铁板中鱼最多,然后是亮片,VIB和铅头钩T尾没钓上来。
亮片咬口最清晰,duang的一下,很刺激过瘾。
期待国庆假期天津海钓实战,目标:中一条鱼。
下午重温了新开服的暴雪卡片游戏《炉石传说》,一晃10年过去了。
充值128,分解了一张金色传说卡牌,配了个自残术牌组。
可惜,网易服务器没搞好,登录要排队15-20分钟,进去打一局必掉线,然后又要排队15分钟...
折腾了三回,热情都被磨光了...
打开两个Notebooklm浏览器tab,扩展屏分屏展示,一个看阅读摘要,一个对话提问。
主屏heptabase记笔记,raycast AI随时唤起查背景知识,相当完美。 https://t.co/D12FRhuBAG 
Tim ferris访谈畅销书作家伊丽莎白,她提到一个“双向祈祷”很有趣。
她三十岁时第一次离婚,非常绝望,人生处于低谷,为了让自己恢复,她开始尝试用朋友或亲人的口吻给自己写信,写下最希望别人对她说的话。
练习方法:
1. 找个安静的地方:随着练习时间变长,可以在任何地方进行。
2. 读些让你感到神圣的东西,有助于打开心扉。 比如哈菲兹、鲁米、玛丽·奥利弗或沃尔特·惠特曼的诗歌。
3. 只问一个问题。例如“亲爱的,你今天想让我知道什么?” 避免对话,因为这会让你的自我意识参与进来。
4. 第一行回复以一种爱称开始,例如“亲爱的”、“我的孩子”、“我的宝贝”。 伊丽莎白经常听到“我的小宝贝”这个称呼。
5. 写下你希望别人对你说的话,因为你知道自己渴望什么样的爱。
“双向祈祷”源于一个古老的精神练习,在12步戒瘾疗法中也非常常见。
避免问“为什么”这类问题(往往没有答案),多问一些以“如何”开头的、指向具体行动的问题。例如“你希望我如何度过这段时间?” 
前几天还想有没有社交媒体聚合发布工具,今天刷到一个Chrome插件叫“爱贝壳内容同步助手”,支持同步发动态、文章、短视频到多个平台。
免费版能发3条,付费版不限制,一年只需要60块,开发者定价很良心。
我认为大多数最好的生活基于创造的冲动,而大多数最糟糕的生活源于对占有的热爱。 --罗素 https://t.co/wZvr9Kbfjg https://video.twimg.com/ext_tw_video/1839632787986604032/pu/vid/avc1/480x854/avGKf-HVVErOqWUX.mp4?tag=12
一步到位,直接上好装备,免得以后心痒痒升级花更多钱。(为败家找借口 😁) https://t.co/IQJElqrdQg 
终于读完《智人之上》,把epub转成pdf,传到Notebooklm对话总结。
Epub转PDF:https://t.co/tJ6Wyn9it2
NotebookLM:https://t.co/LF0cN1MmPE
天真的信息观
天真的信息观认为,信息的主要作用是呈现现实、揭示真相。
只要我们不断收集更多信息,并进行准确分析,就能更接近真理。但实际上,大多数信息并非为了追求真理,而是为了建立和维持社会秩序,这常常需要牺牲部分真相,例如:
① 官僚制度通过文件、档案、表格等形式,将信息标准化和分类,提高了社会运作效率,但也可能导致僵化和扭曲,忽视现实的复杂性。
② 神话故事通过构建共同的信念和价值观,将人们团结在一起,但也可能被用来掩盖真相,甚至成为权力滥用的工具。
印刷术和信息网络失控
印刷术的出现,使得宗教经典能够大规模复制和传播,打破了教会对知识的垄断,促进了个人主义和理性主义的兴起。同时,印刷术也促进了标准化语言的形成,有利于民族意识的形成和民族国家的建立。
然而,印刷术带来的信息爆炸也对传统的社会秩序构成挑战。例如,猎巫行动的兴起,部分原因就是印刷术的普及,使得关于巫术的书籍和谣言大量传播,加剧了社会恐慌和对异端的迫害。
民粹主义的危害
民粹主义者往往声称自己代表人民,将"人民的权力"绝对化,无视人民内部的多元性和利益差异。
他们不信任任何独立于"人民意志"之外的权威机构,包括法院、媒体和学术机构,认为这些机构是"精英阶层"的工具。
民粹主义者会试图削弱或控制这些机构,以消除对自身权力的制约。
然而,这些独立机构正是民主制度中重要的自我修正机制,能够有效地监督权力、揭露真相和纠正错误。一旦这些机制遭到破坏,民主制度就很容易滑向独裁。
算法可能产生偏见
人工智能算法的学习依赖于训练数据,而这些数据本身就可能包含人类社会的偏见。
如果用于训练招聘算法的数据集中,男性员工的比例远高于女性员工,那么算法就可能学会偏向男性,在招聘过程中给予男性更高的评分。
算法的学习需要一个明确的目标。然而,目标的设定本身就可能带有主观性和偏见。
另外,算法的决策过程往往缺乏透明度,难以被人类理解和监督,这使得算法的偏见难以被发现和纠正,缺乏自我修正机制。
人工智能伦理难题
康德义务论的核心观点是道德行为应该遵循普遍适用的理性原则,但在实践中却常常遇到困难。
这是因为在现实生活中,人们往往会根据身份认同来区分"自己人"和"外人",并对不同群体区别对待。
假设一台遵守康德"普世规则"、并且想要继续存在的计算机,可能会认为"消灭人类"是一种可以接受的行为。
因为"消灭人类"并不会威胁到作为非生物体的计算机自身的安全,因此这条规则在逻辑上是"普世的"。
计算机不具有生物体对死亡的恐惧,因此它可能无法理解人类对生命的珍视。
即使计算机能够理解和应用康德的义务论,它也可能得出"人类的生命不值得保护"的结论。
所以,依靠抽象的理性原则来构建人工智能伦理框架是远远不够的,需要考虑到人工智能的非生物特性、以及其与人类社会之间复杂的互动关系。
关于功利主义
功利主义认为,能够最大化快乐、最小化痛苦的行为才是道德的行为。
在实际应用中,功利主义面临着如何量化快乐和痛苦的难题。
以“痛苦值”和“快乐值”为例,在复杂的历史情境中,很难准确计算某个行为对世界整体快乐和痛苦总和的影响。
当某个行为带来的痛苦或快乐的结果非常明显时,功利主义可以提供清晰的道德判断。
以纳粹大屠杀为例,大屠杀给犹太人带来了巨大的痛苦,而对其他人(包括德国人)并没有带来相应的利益,因此从功利主义的角度来看,大屠杀是绝对不道德的。
以同性恋为例,对同性恋的迫害给当事人带来了巨大的痛苦,而这种迫害的理由往往是基于偏见和没有实证依据的道德准则,因此从功利主义的角度来看,对同性恋的迫害也是不合理的。
但是,当面对一些难以量化的痛苦或快乐时,例如对死亡的恐惧、对抽象概念的理解等,功利主义难以做出准确的判断。
当不同的道德原则发生冲突时,例如为了保护人权是否可以发动战争,功利主义也难以提供明确的指导。
作者对人工智能时代信息网络的看法
① 信息网络的本质并非在于呈现真相,而是在于联结和维持秩序。
② 从部落社会到现代社会,信息网络的演变伴随着权力的转移。掌握信息网络关键节点的群体或个体将获得更大的权力。
③ 人工智能的出现将催生新的信息网络形态,其影响力远超印刷术或工业革命。
④ 以往的技术革命,例如印刷术革命、工业革命,本质上都是为人类提供了新的工具和手段,而人工智能革命则将非人类智能体(即人工智能)引入信息网络,使其成为主动的参与者和决策者。
⑤ 人工智能是人类历史上第一个能够自行做出决策并产生想法的技术,其潜在风险远超以往任何技术革命。
信息网络史
史前时代 - 公元前1000年:
① 人类生活以小型狩猎采集游群为主,信息网络分布式,口口相传,民主决策。
② 随着农业发展和社会规模扩大,出现中央集权的官僚体系,信息网络从人际网络转变为人与文件互动,信息检索成为难题。
③ 神话故事成为维系社会秩序的重要工具,但也可能掩盖真相。
公元前1000年 - 公元1500年:
① 犹太教利用“书”这项新技术,试图绕过人类中介,直接传播神的旨意,并通过大量复制宗教经典来维护文本权威,限制权力滥用。
② 基督教兴起,教会机构在整理、诠释宗教经典的过程中,获得了巨大的权力。
③ 印刷术发明之前,信息传播受限,大规模极权政权难以出现。
公元1500年 - 1900年:
① 印刷术推动信息传播,促进科学革命和启蒙运动,但也为极权主义兴起提供了技术基础。
② 现代官僚制度形成,依赖清单列表和数据管理,与神话故事共同塑造社会秩序。
20世纪:
① 电报、无线电等现代信息技术出现,信息传播速度和范围大幅提升,极权政权得以监控和控制人民生活。
② 冷战时期,民主与极权两种信息网络模式形成鲜明对比。
21世纪:
① 互联网和人工智能兴起,人类进入以算法为基础的新型信息网络。
② 算法在带来便利的同时,也引发了一系列问题,如算法偏见、信息茧房、民主制度受到威胁等。
好几个朋友问智人之上这本书如何,刚读到一半,简单说说。
很多人说不如人类简史和未来简史,但我觉得不错,观点新颖,推演也有一定逻辑。
比如用信息网络特征来解读独裁和民主,宗教和AI。
斯大林时期的苏联,中世纪的猎巫行动,这种类荒诞和恐怖,是如何不可避免的发生,未来再次出现的风险。
原本出于流量目的信息传播算法,不自觉的贴合人性,走向宣扬仇恨和民粹,加剧社会的撕裂。
作者担心AI强大后,极权主义可能会上升到新高度,提前敲响警钟。
为了铺垫论证,宗教,政治内容讲的有点多,相比之前的书,读起来有点累。
总之,仍是一本值得读的书,甚至有朋友感慨,这居然能在国内出版?真不容易。
