加载中...

朋友
推荐
问答
视频
圈子
头像
扭矩泰坦
10-22 18:40 · 江苏
不改超参、不调token:用分位数替代均值,QAE让大模型强化学习更稳定
强化学习总是“要么坍塌要么炸”?QAE 用分位数取代均值,一步让训练稳回安全区。本文提出了一种简洁的强化学习基线改进方法——分位数优势估计(Quantile Advantage Estimation,QAE)。QAE 使用 K 分位数基线替代传统的均值基线,在响应层面形成“难题强化罕见成功、易题抑制剩余错误”的双门控机制。
查看全文
人工智能
头像
扭矩泰坦
10-22 18:36 · 江苏
告别「偏科」,UniVid实现视频理解与生成一体化
在视频生成与理解的赛道上,常常见到分头发力的模型:有的专注做视频生成,有的专注做视频理解(如问答、分类、检索等)。而最近,一个开源项目 UniVid,提出了一个「融合」方向:把理解 + 生成融为一体 —— 他们希望用一个统一的模型,兼顾「看懂视频」+「生成视频」的能力。
查看全文
人工智能
头像
纳米榫卯
10-22 18:32 · 江苏
大模型微调范式认知再被颠覆?UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解
在大模型微调实践中,SFT(监督微调)几乎成为主流流程的一部分,被广泛应用于各类下游任务和专用场景。比如,在医疗领域,研究人员往往会用领域专属数据对大模型进行微调,从而显著提升模型在该领域特定任务上的表现。然而,问题随之而来:SFT 是否会让模型 “遗忘” 原本的通用能力? 过去的研究中,不少文献指出,领域微调固
查看全文
人工智能
头像
纳米榫卯
10-22 18:30 · 江苏
RewardMap: 通过多阶段强化学习解决细粒度视觉推理的Sparse Reward
本研究由西湖大学 ENCODE Lab 牵头,联合同济大学、浙江大学和新加坡国立大学共同完成。团队在大模型强化学习与多模态推理方向具有深厚研究基础。近年来,大语言模型(LLMs)以及多模态大模型(MLLMs)在多种场景理解和复杂推理任务中取得突破性进展。但一个朴素而尖锐的问
查看全文
行业交流
头像
纳米榫卯
10-22 18:04 · 江苏
长生不老成真?哈佛AI数周破解「衰老密码」,人类寿命或迎重写
编辑:倾倾【新智元导读】长生不老
查看全文
人工智能
头像
纳米榫卯
10-22 18:02 · 江苏
ChatGPT缔造者联手DeepMind大神,用AI攻坚高温超导,半个硅谷抢着投
编辑:艾伦 好困【新智元导读】O
查看全文
人工智能
头像
纳米榫卯
10-22 17:33 · 江苏
锁死一致性!Vidu Q2「参考生」可算来了,新功能强到离谱,APP全面进化
编辑:编辑部【新智元导读】蹲了半个月,Vi
查看全文
人工智能
头像
纳米榫卯
10-22 17:29 · 江苏
墙体的AI革命!智能超表面如何让建筑「听懂」6G信号?
查看全文
5G/6G通讯技术
头像
纳米榫卯
10-22 16:21 · 江苏
UP主用AI打造美食综艺,B站播放量破400万;AI街采视频又有新玩法火了 | AI一周热门
过去一周,是谁在用AI产出爆款,或围绕AI创作好玩有趣的内容?欢迎来到“AI新榜”推出的「AI一周热门」栏目。结合新榜数据以及内容新鲜度、话题讨论度,每周为你搜索、筛选全网最值得一看的AI相关热门内容,了解AI创作风向!也欢迎在新榜官网(
查看全文
人工智能
头像
纳米榫卯
10-22 16:18 · 江苏
长文本生成迎来新突破:拓元智慧推出 DrDiff ,实现效率与质量双提升
DrDiff 框架的核心思想是“动态化”,
查看全文
人工智能
正在加载
帖子
视频
动态
资讯

苏ICP备2021030733号

32011402011102

智造者(南京)创新科技有限公司 版权所有

联系电话:400-816-5816

联系地址:南京市江宁区谷里街道孝义路西塘80-1号A栋

投诉渠道:service@zhizaozhe.com