尊龙体育网简略看一下他们的 Use Case-尊龙凯时人生就是博·(中国大陆)官方网站

尊龙凯时人生就是博·(中国大陆)官方网站

尊龙凯时人生就是博·(中国大陆)官方网站

尊龙体育网简略看一下他们的 Use Case-尊龙凯时人生就是博·(中国大陆)官方网站

发布日期:2026-05-01 04:15    点击次数:141

尊龙体育网简略看一下他们的 Use Case-尊龙凯时人生就是博·(中国大陆)官方网站

昨天夜里,夜深惊雷。

一个新团队片刻发了一个首款通用型的边幅:Manus。演示在此,我东谈主平直看麻了。

您面前成立暂不解救播放

看完我的第一嗅觉,卧槽,东谈主类又要一败涂地了。

这便是 OpenAI 的 DeepResearch 和 Claude 的 Computer Use 的究极联结体,以致,它还能我方写代码,平直 Coding Agent。

这是什么怪物啊!

我预感到这一天会来,仅仅没猜度,来得如斯之早。

Manus 在 GAIA 的评分上,也相等离谱。

依然杰出 OpenAI 的 DeepResearch 的了,成为 GAIA 评分第一。

可能许多东谈主不知谈 GAIA 是个啥,我浅薄说一下。

GAIA 是一个面向通用 AI 助手才略的基准评测体系,由 Meta AI、Hugging Face 等磋议团队于 2023 年残酷。

有一篇相等着名的论文:

内部有 466 个全心想象的问题。

传统的测试一般齐是数学或者一些专科学问问答、编程等等,然而 GAIA 测试,内部许多齐是见解浅薄,然而需要多要害措置的内容问题。

其等分为三个级别,Lv.1、Lv.2、Lv.3,难度轮番递加。

想通过 GAIA 的测试,一般需要汇注检索才略、器具调用才略、编程才略、文献处理才略等等。

在 2023 年的工夫,东谈主类一般能达到 90% 的奏遵循,而那工夫的最强 AI GPT4,在第一级才凑合达到 15%。

再看这张图,你就知谈,有多强了。

说真话,我面前还舒服为 ChatGPT 每个月齐氪 200 刀,主要便是 o1 Pro 和

DeepResearch,这两玩意有一说一,在我作念一些磋议和需要强推理任务的工夫,还辱骂常好用的。

而 Manus 这波,把 DeepResearch 干碎了,要知谈,它之前依然是最强了。

面前有个很难顶的问题是封测中,是以唯有邀请码的用户才智体验到。

是以,我也动用了我的东谈主脉,花了十分钟的时辰,相干到了 Manus 团队的东谈主,相等荣幸地获取了邀请码。

不外,即使是莫得拿到邀请码的用户,也可以去他们官网,简略看一下他们的 Use Case,每一个,齐相等异常想。

而淌若你有了邀请码,时常登录进去以后,便是一个大大的界面:

诚然齐是一个对话框,然而 Manus 的才略还不太一样,他不是阿谁你残酷个问题,AI 一会就会平直给你回话 Chatbot。

而是当你残酷问题之后,它会字据你的问题和条目,来拆辞退务,进行非常复杂的任务筹办和实践。

况且会在云霄自动运行,你可以平直退出去,等运行结束,会奉告你。

比如之前的那篇 GAIA 的论文,我想把 PDF 造成一个能拿出去讲的 PPT,我把这个条目提给 Manus 的工夫。

它会先把我的需求拆解。

我是这样说的:

1. 我但愿你写一段 Python 模范,用 OCR 把这篇论文的 PDF 信息索取出来。

2. 将 PDF 内部的信息回来成 PPT 大纲。

3. 按照小米发布会的作风,作念一份给泛泛东谈主科普用的 PPT。

4. 给我 PPT 的下载文献。

它会开动花小数时辰来相识。

然后,在右边的窗口上,运行一个臆造机,准备开动实践操作。

在臆造机开启之后,会第一时辰,列一份 To Do List。

然后,就会开动实践第一个任务,装配 python 库。

完成的边幅,会沿途在右边的预览窗口打 x。

他们用了一个相等兴味兴味的交互体式,便是及时加进程同步。

右边的界面就像 PPT 一样,束缚的下一页下一页,让你及时的看到,现时这个 Manus 正在作念什么,你能看到它的每小数量的,每一个四肢,这个掌控感果然太强了。

即使要等很久,你看着它在小数小数实践,这个嗅觉也果然很爽。

而右下角的任务要害也可以伸开,相等直不雅地告诉你,大要害进行到哪一个阶段了。

交互作念得极棒。

我这个 case,只需要等简略几分钟以后,一个 PPT 就出来了。

望望 PPT:

信息是没问题的,便是这好意思感 = = 照旧欠缺了小数,然而在信息的排版和内容质地上,果然高到爆炸。

这个其实并不是特等能展示它的才略,我再展示另一个,我也曾试图让所有 Agent 尝试的例子,帮我整剪发票。

我频繁要出差,是以有一堆前仰后合的发票需要让公司报销的,然而公司的大总管呢,制定了一个 SOP,便是发票你弗成平直打包给她,这样太乱,是以需要作念成一个 excel 的模板,这样她好对账。

便是这样的,然而你知谈,我要每个月把我的十几张发票,齐处理成表格,果然很贫苦。

是以,当我抱着碰走时的立场,把这个任务交给 Manus 的工夫,我畏忌了。

因为,它奏效了。

我那时就周身发麻了,真实太给力了。你们懂那种,周身触电的嗅觉嘛!

我给大家过一下经由。

最开动,我的 Prompt 超等浅薄。

就这样简浅薄单的一句话。

它在想考完以后,处理成了 8 步任务。

然后,解压压缩包,装配 OCR 依赖,索取发票,整理成表格等等等等。

我什么也没干,它就我方这样跑着。

9 分钟以后,辅导我任务完成了。

我一趟来,就看到了这个画面。

唯有一个小所在没填上,其他齐是对的。

太离谱了,这还需要东谈骨干吗?

我还用它,分析了一下阿里巴巴股票。

通常的 case,咱们先望望 OpenAI 的 DeepResearch 的戒指。

质地是可以,很高,然而对比一下 Manus,那可读性真实是有点不胜重担了。

Manus 平直把任务拆解成了 8 步。

最蹙迫的是,当它完成的工夫,所输出的内容。

当我看到所谓的汇报,给出的是一个结合的工夫,我就猜到,这个事情有点不浅薄了。

点进去以后,果然:

不仅图文并茂,这尼玛,这些图标图表尽然是可以交互的。

我果然给跪了,我想给 Manus 磕一个。

然后今天 QwQ 不是开源了 32B 的推理模子吗,我又让 Manus 顺手作念了一个千问开源的时辰线。

在履历了 30 多分钟后,一张时辰线的舆图就出来了。大家可以考证一下望望准不准。

我无话可说,东谈主已跪地。

短短的几个小时的体验时辰

东谈主类果然行将,一败涂地。

在 Manus 的 prompt 手段上,我我方试了下,你的点,一定要饱和的明晰,形色越明晰具体,Manus 就能实践得越精确。

明确讲解你的守望、形态要乞降质地模范,可以大幅扶助最终委用物的匹配度。

这小数,相等蹙迫。

2025 年 3 月 6 日,我认为,即使在 AI 圈,亦然一个值得牢记的日子。

阿里开源 QwQ-32B,以如斯尺寸在性能上追平 DeepSeek R1 满血版,另一边,Manus 彻夜崛起,把 Agent 工程带上了一个新的高度。

而这两个团队,齐属于咱们中国。

没错,齐是中国团队。

为之骄矜吧。

整夜的这一派星空,属于 China。

全国尊龙体育网,正在为咱们而耀眼。



尊龙凯时人生就是博·(中国大陆)官方网站

昨天夜里,夜深惊雷。 一个新团队片刻发了一个首款通用型的边幅:Manus。演示在此,我东谈主平直看麻了。 您面前成立暂不解救播放 看完我的第一嗅觉,卧槽,东谈主类又要一败涂地了。 这便是 OpenAI 的 DeepResearch 和 Claude 的 Computer Use 的究极联结体,以致,它还能我方写代码,平直 Coding Agent。 这是什么怪物啊! 我预感到这一天会来,仅仅没猜度,来得如斯之早。 Manus 在 GAIA 的评分上,也相等离谱。 依然杰出 OpenAI 的 D