相关耗材可不止3.5个月翻翻[允悲]//@蚁工厂:@zibuyu9 老师//@马少平THU:刘知远团队
@清华大学
【#科研速递# | 清华团队提出“密度法则”揭示大模型高效化发展内在趋势】 近日,清华大学团队与大模型开源社区OpenBMB合作,提出大模型“密度法则”概念,指出大模型的最大“能力密度”随时间呈指数级增长:2023年2月至2025年4月,大模型最大“能力密度”约每3.5个月翻一番。为了量化“能力密度”,研究团队设计了相对“能力密度”的评估框架。
该研究强调密度优化是大模型发展的关键路径,源于架构、算法和数据处理的进步。研究成果以“大模型密度法则”为题,于11月20日作为封面文章,发表于《自然·机器智能》。论文链接:网页链接 (来源:计算机系)