名称-标题-智造者

Deep行者

04-29 23:37 · 江苏

确认！DeepSeek多模态AI已经开测

DeepSeek的视觉功能，真的来了！！DeepSeek研究员陈小康发帖放出一条消息——Now, we see you.

查看全文

节点卫士

04-27 23:00 · 江苏

突发！炸场！GPT-5.5与国产DeepSeek V4竟然同日宣战

北京时间4月24日，全球AI圈迎来历史性一刻——海外巨头OpenAI与国产领军企业DeepSeek同步官宣旗舰模型新品，GPT-5.5与DeepSeek V4隔空对垒、同日“宣战”，打破了行业长期以来的竞争节奏。一边是垄断AI话语权的海外巨头，一边是崛起的国产开源力量，这场巅峰对决不仅牵动着全球开发者的神经，更恰逢国内AI监管政策落地的关键节点，既是技术实力的正面较量，也是国产模型突围与行业规范发

查看全文

技术拓荒录

04-24 09:49 · 江苏

DeepSeek连夜改页面，免费的AI用不长了

摘要：算力短缺，已经是AI赛道“房间里的大象”。凤凰网科技出品作者｜路春锋编辑｜董雨晴4月8日凌晨，DeepSeek悄悄上线了一种新的分层模式界面：在网页版/App中出现了“快速模式（Fast）”和“专家模式（Expert）”两个入口，同时还有一个带图标的“视觉模式（Vision）”选项正在灰度测试。图｜Deepseek网页版截图新的功能分工十分明确：快速模式面向日常对话和低延迟响应；专家模式针

查看全文

Deep行者

04-19 04:00 · 江苏

梁文锋，被曝融资20亿！

估值680亿！曝DeepSeek首次融资。编译 | 江宇编辑 | 李水青智东西4月17日消息，今日，据外媒The Information报道，DeepSeek正首次寻求外部融资，目标估值超过100亿美元（约合人民币681.8亿元）。据多位知情人士透露，DeepSeek已开始与投资人接触，计划融资至少3亿美元（约合人民币20.5亿元），以补充资金储备，应对AI大模型研发日益高昂的成本竞争。如果本

查看全文

Deep行者

04-19 04:00 · 江苏

万字长文！黄仁勋：DeepSeek深度耦合华为，对美国来说将是灾难

文 / 黄仁勋美国工程院院士、NVIDIA创始人兼首席执行官来源：C114通信网文章仅代表作者本人观点4月15日，英伟达CEO黄仁勋接受播客主持人Dwarkesh Patel的深度访谈，就英伟达如何掌控日益紧张的先进芯片供应链？TPU能否打破英伟达在AI计算领域的垄断地位？为什么英伟达不成为超大规模数据中心运营商？美国是否应该向中国出售 AI 芯片？为什么英伟达不生产多种不同的芯片架构？等热

查看全文

齿轮啮合诗人

03-12 23:56 · 江苏

DeepSeek开源新模型！

年底了，DeepSeek又开始发力了，刚刚开源了新模型DeepSeek-OCR 2：首创双流（双向+因果）注意力架构，model&paper一同发布。开源地址：https://huggingface.co/deepseek-ai/DeepSeek-OCR-2论文地址：https://github.com/deepseek-ai/DeepSeek-OCR-2/blob/main/DeepSeek_O

查看全文

生物信息狂徒

03-01 00:09 · 江苏

DeepSeek发布下一代技术！北大实习生立功

DeepSeek又找到突破大模型推理瓶颈的新方法了！智东西2月27日报道，昨天，DeepSeek发布了一项名为DualPath的全新推理系统方案，直指当前大语言模型在智能体应用场景下遭遇的短板——KV缓存存储I/O瓶颈。该方案通过引入双路径加载机制，显著提升系统吞吐量，基本消除了KV缓存的I/O开销。DualPath的核心创新在于开辟了一条从存储直通解码引擎的新通道。KV缓存不再仅由预填充引擎加载

查看全文

齿轮学者

02-20 04:19 · 江苏

用内存换显存，Engram 架构让大模型学会“查字典”

最近 DeepSeek 联合北京大学发布了一篇非常有意思的新论文，叫《Conditional Memory via Scalable Lookup》（基于可扩展查找的条件记忆）。这篇论文没有去卷参数规模，也没有去卷更长的上下文窗口，而是从架构底层提出了一个新思路：如何让大模型用一种更“省力”的方式来记忆知识。简单总结就是：他们复活了经典的 N-gram 技术，给 Transformer 模型装了一

查看全文

代码幻影

02-13 00:49 · 江苏

字节要复现又一个DeepSeek时刻了？

摘要：接下来，影视行业的一切价值都将重估。凤凰网科技出品作者｜姜凡、尚志芳编辑｜董雨晴一年前的春节，一家中国公司用R1大模型震撼全球科技界。凭借算法创新突破算力限制，以较低训练成本达到以往AI大模型靠堆算力、拼资金和数据的效果，外媒将这一突破称为“DeepSeek时刻”。那场技术地震的余波尚未平息，2026年2月，字节跳动似乎正准备接棒，在视频生成领域制造另一场海啸。就在几天前，字节跳动旗下的最

查看全文

代码幻影

02-13 00:47 · 江苏

DeepSeek突然测试新模型，春节大招要来了？

摘要：此番升级并未包含多模态视觉理解能力，模型仍聚焦于纯文本与语音交互路径。凤凰网科技出品继被曝出全新V4系列架构规划后，国产大模型头部玩家深度求索今日傍晚逐步推送了一个关键更新。2月11日，多位用户反馈DeepSeek已在网页及App端开启灰度测试，核心上下文窗口由原有的128K直接提升至1M（百万Token）级别。经凤凰网科技实测，其自身反馈的上下文长度已更新。此外，当前版本模型在非联网状态

查看全文