加载中...

加载中...

图片
头像
主题 0 成员 0
加入
提示:
请先关注智造圈~
头像
纳米榫卯
10-28 20:08 · 江苏
DeepSeek最会讨好,LLM太懂人情世故了,超人类50%
用过大模型的都知道,它们多多少少存在一些迎合人类的行为,但万万没想到,AI 模型的迎合性比人类高出 50%。在一篇论文中,研究人员测试了 11 种 LLM 如何回应超过 11500 条寻求建议的查询,其中许多查询描述了不当行为或伤害。结果发现 LLM 附和用户行为的频率比人类高出 50%,即便用户的提问涉及操纵、欺骗或其他
查看全文
头像
品牌智造
10-26 18:29 · 江苏
DeepSeek开源的新模型,有点邪门
查看全文
头像
全栈 007
10-23 18:59 · 江苏
DeepSeek与智谱同日出手,将语言压缩成视觉是下一个扩展方向
就在硅谷还在为大模型像不像松鼠争论不休时,来自中国的DeepSeek与智谱,只干不说,几乎同时抛出了自己如何教会大模型,像人类一样“看懂”文本的模型与论文。“松鼠”是强化学习之父萨
查看全文
头像
乌龙茶
10-23 15:56 · 未知
DeepSeek 在注意力机制方面的技术改进
由于注意力机制面临显存开销和计算复杂度两大发展瓶颈,为了不断通过 Scaling Law 提升大模型长文本处理能力和模型性能,AI 产业不断在进行算法、系统、硬件三个层面的提升和优化。其中在算法层面,DeepSeek 作为开源大模型领域的代表和低成本模型方向的标杆,在注意力机制的技术改
查看全文
头像
品牌智造
10-22 18:20 · 江苏
DeepSeek的新模型很疯狂:整个AI圈都在研究视觉路线,Karpathy不装了
编辑:泽南、Panda「我很喜欢新的 DeepSeek-OCR 论文…… 也许更合理的是,LLM 的所有输入都应该是图像。即使碰巧有纯文本输入,你更应该先渲染它,然后再输入。」
查看全文
头像
品牌智造
10-22 17:25 · 江苏
文本已死,视觉当立!Karpathy狂赞DeepSeek新模型,终结分词器时代
编辑:KingHZ 好困【新智元导读】AI
查看全文
头像
全球趋势
10-22 11:51 · 江苏
太强了!DeepSeek刚刚开源新模型,用视觉方式压缩一切
来源:AI思想会【前言
查看全文
头像
钳行天下
10-22 11:30 · 江苏
Karpathy盛赞DeepSeek-OCR“淘汰”tokenizer!实测如何用Claude Co
作者 | 褚杏娟
查看全文
头像
气缸幻影
10-22 11:25 · 江苏
热点关注丨DeepSeek新模型被硅谷夸疯了!用二维视觉压缩一维文字,单GPU能跑,“谷歌核心机密被
DeepSeek最新开源的模型,已经被硅谷夸疯了!因为实在太DeepSeek了。3B规模、指数级效能变革、大道至简,甚至被认为把谷歌Gemini严防死守的商业机密开源了。唯一的问题可能就是被“OCR”命名耽误了。是的,DeepSeek刚刚开源即火爆的模型就叫:DeepSeek-OCR。
查看全文
头像
扭矩泰坦
10-12 20:33 · 江苏
千亿美金涌入中国科技股!“DeepSeek时刻”引爆价值重估
中国工业报 吴晨 王珊珊近日,一只由美国锐联投资研究发行的中国科技股ETF(交易型开放式指数基金)在纳斯达克上市,其前十大重
查看全文