加载中...

加载中...

图片
头像
主题 0 成员 0
加入
提示:
请先关注智造圈~
头像
Deep行者
9小时前 · 江苏
确认!DeepSeek多模态AI已经开测
DeepSeek的视觉功能,真的来了!!DeepSeek研究员陈小康发帖放出一条消息——Now, we see you.
查看全文
头像
节点卫士
04-27 23:00 · 江苏
突发!炸场!GPT-5.5与国产DeepSeek V4竟然同日宣战
北京时间4月24日,全球AI圈迎来历史性一刻——海外巨头OpenAI与国产领军企业DeepSeek同步官宣旗舰模型新品,GPT-5.5与DeepSeek V4隔空对垒、同日“宣战”,打破了行业长期以来的竞争节奏。一边是垄断AI话语权的海外巨头,一边是崛起的国产开源力量,这场巅峰对决不仅牵动着全球开发者的神经,更恰逢国内AI监管政策落地的关键节点,既是技术实力的正面较量,也是国产模型突围与行业规范发
查看全文
头像
技术拓荒录
04-24 09:49 · 江苏
DeepSeek连夜改页面,免费的AI用不长了
摘要:算力短缺,已经是AI赛道“房间里的大象”。凤凰网科技 出品作者|路春锋编辑|董雨晴4月8日凌晨,DeepSeek悄悄上线了一种新的分层模式界面:在网页版/App中出现了“快速模式(Fast)”和“专家模式(Expert)”两个入口,同时还有一个带图标的“视觉模式(Vision)”选项正在灰度测试。图|Deepseek网页版截图新的功能分工十分明确:快速模式面向日常对话和低延迟响应;专家模式针
查看全文
头像
Deep行者
04-19 04:00 · 江苏
梁文锋,被曝融资20亿!
估值680亿!曝DeepSeek首次融资。编译 |  江宇编辑 |  李水青智东西4月17日消息,今日,据外媒The Information报道,DeepSeek正首次寻求外部融资,目标估值超过100亿美元(约合人民币681.8亿元)。据多位知情人士透露,DeepSeek已开始与投资人接触,计划融资至少3亿美元(约合人民币20.5亿元),以补充资金储备,应对AI大模型研发日益高昂的成本竞争。如果本
查看全文
头像
Deep行者
04-19 04:00 · 江苏
万字长文!黄仁勋:DeepSeek深度耦合华为,对美国来说将是灾难
文 /  黄仁勋  美国工程院院士、NVIDIA创始人兼首席执行官来源:C114通信网文章仅代表作者本人观点4月15日,英伟达CEO黄仁勋接受播客主持人Dwarkesh Patel的深度访谈,就英伟达如何掌控日益紧张的先进芯片供应链?TPU能否打破英伟达在AI计算领域的垄断地位?为什么英伟达不成为超大规模数据中心运营商?美国是否应该向中国出售 AI 芯片?为什么英伟达不生产多种不同的芯片架构?等热
查看全文
头像
齿轮啮合诗人
03-12 23:56 · 江苏
DeepSeek开源新模型!
年底了,DeepSeek又开始发力了,刚刚开源了新模型DeepSeek-OCR 2:首创双流(双向+因果)注意力架构,model&paper一同发布。开源地址:https://huggingface.co/deepseek-ai/DeepSeek-OCR-2论文地址:https://github.com/deepseek-ai/DeepSeek-OCR-2/blob/main/DeepSeek_O
查看全文
头像
生物信息狂徒
03-01 00:09 · 江苏
DeepSeek发布下一代技术!北大实习生立功
DeepSeek又找到突破大模型推理瓶颈的新方法了!智东西2月27日报道,昨天,DeepSeek发布了一项名为DualPath的全新推理系统方案,直指当前大语言模型在智能体应用场景下遭遇的短板——KV缓存存储I/O瓶颈。该方案通过引入双路径加载机制,显著提升系统吞吐量,基本消除了KV缓存的I/O开销。DualPath的核心创新在于开辟了一条从存储直通解码引擎的新通道。KV缓存不再仅由预填充引擎加载
查看全文
头像
齿轮学者
02-20 04:19 · 江苏
用内存换显存,Engram 架构让大模型学会“查字典”
最近 DeepSeek 联合北京大学发布了一篇非常有意思的新论文,叫《Conditional Memory via Scalable Lookup》(基于可扩展查找的条件记忆)。这篇论文没有去卷参数规模,也没有去卷更长的上下文窗口,而是从架构底层提出了一个新思路:如何让大模型用一种更“省力”的方式来记忆知识。简单总结就是:他们复活了经典的 N-gram 技术,给 Transformer 模型装了一
查看全文
头像
代码幻影
02-13 00:49 · 江苏
字节要复现又一个DeepSeek时刻了?
摘要:接下来,影视行业的一切价值都将重估。凤凰网科技 出品作者|姜凡、尚志芳编辑|董雨晴一年前的春节,一家中国公司用R1大模型震撼全球科技界。凭借算法创新突破算力限制,以较低训练成本达到以往AI大模型靠堆算力、拼资金和数据的效果,外媒将这一突破称为“DeepSeek时刻”。那场技术地震的余波尚未平息,2026年2月,字节跳动似乎正准备接棒,在视频生成领域制造另一场海啸。就在几天前,字节跳动旗下的最
查看全文
头像
代码幻影
02-13 00:47 · 江苏
DeepSeek突然测试新模型,春节大招要来了?
摘要:此番升级并未包含多模态视觉理解能力,模型仍聚焦于纯文本与语音交互路径。凤凰网科技 出品继被曝出全新V4系列架构规划后,国产大模型头部玩家深度求索今日傍晚逐步推送了一个关键更新。2月11日,多位用户反馈DeepSeek已在网页及App端开启灰度测试,核心上下文窗口由原有的128K直接提升至1M(百万Token)级别。经凤凰网科技实测,其自身反馈的上下文长度已更新。此外,当前版本模型在非联网状态
查看全文