搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
1 天
海光DCU国产化适配DeepSeek V3与R1模型正式上线,AI加速新纪元来临
在人工智能技术迅猛发展的当下,国产化适配能力逐渐成为行业竞争的关键因素。IT之家在2月4日报道,中科曙光国家先进计算产业创新中心有限公司正式宣布,海光信息技术团队已成功完成了DeepSeek ...
1 天
DeepSeek V3和R1模型完成海光DCU国产化适配并正式上线
IT之家 2 月 4 日消息,中科曙光国家先进计算产业创新中心有限公司昨日发文宣布,海光信息技术团队成功完成 DeepSeek V3 和 R1 模型与海光 DCU(深度计算单元)国产化适配,并正式上线。
2 天
解构DeepSeek-R1:一场AI效率革命背后的技术突破
科技圈从来不缺新闻,但 DeepSeek-R1 的出现,却像一颗石子投入平静的湖面,激起了层层涟漪。这家来自中国的 AI 初创公司,以其开源的推理大模型 R1,正在搅动全球 AI 格局。R1 不仅拥有媲美甚至超越 OpenAI o1 ...
12 天
阿里云通义大模型新技术:MoE模型训练专家平衡的关键细节
本周,在阿里云通义千问 Qwen 团队提交的一篇论文中,研究人员发现了目前最热门的 MoE(混合专家模型)训练中存在的一个普遍关键问题,并提出一种全新的方法——通过轻量的通信将局部均衡放松为全局均衡,使得 MoE ...
36氪
21 天
MiniMax震撼开源,突破传统Transformer架构,4560亿参数,支持400万长上下文
目前领先的 LLM 大都基于 Transformer,而 Transformer 核心的自注意力机制是其计算成本的重要来源。为了优化,研究社区可以说是绞尽脑汁,提出了稀疏 ...
36氪
20 天
Transformer作者初创重磅发布Transformer²,AI模型活了,动态调整自己权重
Sakana AI发布了Transformer²新方法,通过奇异值微调和权重自适应策略,提高了LLM的泛化和自适应能力。新方法在文本任务上优于LoRA;即便是从未见过 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈