昨天,AI领域迎来了两个重磅炸弹级的产品发布,引发了业内的广泛讨论:

  • Manus:这款号称全球首个通用AI Agent的产品横空出世,主打自主执行复杂任务,如数据整理、行程规划等。它的出现是否意味着AI助手真正迈向了智能代理的新阶段?
  • QwQ-32B:阿里开源的一款32B参数模型,在多个基准测试中表现优异,甚至能与DeepSeek-R1相媲美,但其参数量仅为后者的1/20。如此小巧的模型是如何实现高效推理能力的?让我们一探究竟。

Manus:AI助手的全新形态

北京时间3月6日凌晨,AI界迎来了一位新星——Manus!

那么,Manus到底是什么?简单来说,传统AI只能聊天,而Manus则直接帮你把事情搞定。

  • 传统AI助手(如ChatGPT / Claude):你提问,它回答。
  • AI Agent(如Manus):你布置任务,它独立思考、规划并执行,最终将完整结果交付给你。

不少朋友戏称它为“AI实习生”,甚至开始担心自己的工作会不会被取代。

Manus的核心亮点案例

  1. 快速完成市场调研

让Manus调研一下AI眼镜的市场情况。它会迅速在网络上搜索相关信息,并生成一份清晰的表格。短短几分钟内,它完成了可能需要数小时才能完成的工作。

不仅如此,它还能像人类一样进行深度调研,生成专业报告。例如,当你让它介绍小米时,它不仅会搜集素材,还会整理成一份完整的文档,并打包成压缩文件供你下载。

打开一看,居然是一份精美的PPT!

  1. 定制化课程开发

假如你需要一个交互式的学习课程,比如关于Transformers的内容。Manus会通过搜索资料、编写代码,最终为你生成一个专属的交互式学习网站。

没错,这个网站是根据你的需求从零生成的,而不是从网上复制粘贴来的。

除此之外,Manus还能胜任旅行规划、保险对比、供应商采购、财报分析等多种任务。

如何体验Manus?

目前,Manus仍处于邀请制阶段,想要体验还需排队。

Manus背后的公司Monica.im其实是一个整合高手。它的核心能力在于将计算资源、虚拟机、Artifacts和内置多个Agent高度集成,更像是一个高效的AI工作流工具,而非真正的通用AI Agent。尽管如此,它在探索新的通用模式方面迈出了重要一步,但距离成为大众可用的产品还有很长的路要走。

随着AI技术的不断进化,未来许多通用Agent的能力可能会被更强大的大模型吸收,其他公司(如Coze、Dify)也可能推出类似产品,竞争将更加激烈。


阿里QwQ-32B:小模型的大能量

与此同时,阿里Qwen团队也带来了令人瞩目的新品——QwQ-32B大模型正式开源!

虽然名字听起来像个表情包,但其实力不容小觑。QwQ-32B仅拥有320亿参数,却在多个基准测试中表现出色,甚至媲美参数量高达6710亿的DeepSeek-R1!其中的秘密武器便是强化学习(Reinforcement Learning)。

从下图可以看出,在AIME24和IFEval等关键基准测试中,QwQ-32B的表现与DeepSeek-R1持平,甚至在某些任务上略胜一筹。

QwQ-32B的技术亮点

  • 冷启动+RL训练:基于预训练模型,通过强化学习提升推理能力。
  • 结果导向奖励机制:摒弃传统的奖励模型,直接以任务结果(如数学题正确率、代码运行成功率)作为评分标准,比传统方法更高效、精准。

如何体验QwQ-32B?

此外,ollama平台也已集成了QwQ-32B,只需运行命令ollama pull qwq即可轻松体验。

意义何在?

过去,运行一个大模型至少需要几块A100显卡。而现在,QwQ-32B仅需24G显存、16核CPU和64G内存即可流畅运行!本地推理模型的时代已然到来。


2025年,AI正在以前所未有的速度改变世界,甚至颠覆我们的工作方式。你认为未来的AI Agent会让哪些职业消失?你最期待AI为你做些什么?欢迎在评论区留言分享你的看法。

关于Manus,懂的人不屑于用,不懂的人可以装一波……咳咳,谁有邀请码,分享一下,让我也装个逼。


🔥 福利时间:关注公众号【何三笔记】,后台回复关键词「20250217」,即可免费领取《清华大学出品DeepSeek使用精髓》系列资料:

  • 【清华大学第一版】DeepSeek从入门到精通.pdf
  • 【清华大学第二版】DeepSeek赋能职场.pdf
  • 【清华大学第三版】普通人如何抓住DeepSeek红利.pdf
  • 【清华大学第四版】DeepSeek+DeepResearch:让科研像聊天一样简单.pdf
  • 【清华大学第五版】DeepSeek与AI幻觉.pdf

公众号二维码