
sp; 26B 的 MoE(混合专家)版本更有意思,它虽然有 260 亿参数,但推理时只激活 38 亿参数,这意味着速度快得飞起,每秒生成的 token 数量比同等规模的模型高出一大截。在 MMLU Pro 上拿到 82.6%,AIME 2026 达到 88.3%,跟 31B 版本咬得很紧,但推理速度快太多了。 &
义成统一管理。京东云于2016年组队,相比腾讯、阿里等头部大厂晚了7年。根据脉脉网友爆料,京东集团为京东云定的目标是2026年增长60%,但内部判断"这个任务基本完成不了"。在业务层面,受全球AI爆发推高硬件成本影响,百度云等云厂商近日相继宣布涨价。京东云于3月18日宣布全系核心产品不涨价,并对多款产品实施更大力度优惠。云主机、AI算力、存储、网络等全系核心产品价格保持稳定,数据库、中间件等产品平
中,31B 版本拿到了 76.9%,MATH-Vision 数学视觉题目 85.6%,医学图像评估 MedXpertQA MM 达到 61.3%。就连音频处理能力也没落下,E4B 和 E2B 这两个移动端版本在 CoVoST 语音翻译测试中分别拿到了 35.54 和 33.47 的分数。 这种参数效率
当前文章:http://x2l4c9.tanhenglu.cn/23fog4/03eu0s.htm
发布时间:04:56:00
国内/05-17
国内/05-21
国内/05-17
国内/05-19
国内/05-20
国内/05-21
国内/05-19
国内/05-18
国内/05-18