DeepSeek官宣测试全新大模型或为V4 Lite

前几天国产AI来了一波爆发，智谱GLM-5、Minimax 2.5及DeepSeek在11日同一天都发布了新的大模型，其中DeepSeek的自然最受关注。此前我们已经报道过了，这次更新主要是提升了上下文能力，达到了1M，而之前的DeepSee V3系列也就是128K，这方面相对前代V3系列大模型提升了7倍。

今晚DeepSeek也在官方群中正式确认了这一点，表示网页及APP版正在测试新的长文本模型结构，支持1M上下文。

同时DeepSeek还强调API服务还没变，还是V3.2系列大模型，只支持128K上下文。

从DeepSeek的介绍来看，这次的新模型还是文本模型，主要提升就是上下文能力，这个在很多领域也非常重要，长对话时很容易因为上下文不够导致大模型记不住之前的内容了。

虽然网上已经有很多实测显示这次的DeepSeek大模型在编程、输出速度等方面提升也非常大，但相比于此前的期待，这次的更新难免有些失望。

这次的大模型显然不是V4，更可能是V4 Lite，因为参数量据悉只有2000亿，比V3系列的6700亿还少很多，因此部分能力比V3还差也是正常。

猜测这个模型是V4 lite，DeepSeek未来发布的V4大模型也不太可能只有一款，而是有不同版本，每个系列有不同的方向和设计，现在的这个V4 Lite只是探路，因此提升的内容不多，而且DeepSeek官方也没有详细说明其技术架构，一切还有待更多信息释放。

传闻中的DeepSeek V4满血版是1.5万亿参数，比V3系列翻倍还多，还会使用之前DeepSeek研究的Engram、mHC等新技术，性能全面提升的同时成本还低，这个期待值还是很高的。

对文章打分

DeepSeek官宣测试全新大模型或为V4 Lite

最新资讯

编辑精选

热门评论

相关文章

OpenAI正在清退冒充美军获得的ChatGPT订阅部分用户被永久封号

与美军合作被骂惨奥特曼内部诉苦：极其煎熬但管不了军方怎么用AI

马云刚定调谈AI 阿里千问负责人林俊旸辞职团队调整内情曝光

开放AI拟与北约签订合约计划在“非机密”网络部署技术

萨姆·奥特曼继续为美国国防部合同辩护称OpenAI不做xAI也会做

OpenAI CEO告知员工：公司对美国国防部的决策没有发言权

Top 10

微信新能力上线可查图片使用次数

极客湾疑似遭"全网封杀"!背后力量深不可测？

极客湾遭"封杀"引热议连YouTube视频都下架了

微信新能力上线可查图片使用次数

苹果不再允许用户扛着MacBook到苹果零售店拷贝Final Cut Pro

极客湾疑似遭"全网封杀"!背后力量深不可测？

对文章打分

DeepSeek官宣测试全新大模型 或为V4 Lite

最新资讯

编辑精选

热门评论

相关文章

Top 10

DeepSeek官宣测试全新大模型或为V4 Lite