Math/Language - 搜索 News

13 小时

【新智元导读】奥特曼罕见地承认了自己犯下的‘历史错误’，LeCun发文痛批硅谷一大常见病——错位优越感。DeepSeek的终极意义在哪？圈内热转的这篇分析指出，相比R1，R1-Zero具有更重要的研究价值，因为它打破了终极的人类输入瓶颈！

5 天

因为根据DeepSeek的研究，模型的进步并非均匀渐进的。在强化学习过程中，响应长度会出现突然的显著增长，这些"跳跃点"往往伴随着解题策略的质变。这种模式酷似人类在长期思考后的突然顿悟，暗示着某种深层的认知突破。

3 天

DeepSeek的成功并非偶然。过去一年中，该公司连续发布了多篇具有划时代意义的学术论文，奠定了其技术领先地位。硅谷科技评论（SVTR）结合内部访谈和专家反馈，认为 ...

因为根据DeepSeek的研究，模型的进步并非均匀渐进的。在强化学习过程中，响应长度会出现突然的显著增长，这些"跳跃点"往往伴随着解题策略的质变。这种模式酷似人类在长期思考后的突然顿悟，暗示着某种深层的认知突破。

新智元报道编辑：KingHZ Aeneas【新智元导读】ETH Zurich等机构提出了推理语言模型（RLM）蓝图，超越LLM局限，更接近AGI，有望人人可用o3这类强推理模型。推理语言模型（Reasoning Language ...