最近看到一个文档:OpenAI Agent测试报告.pdf。其中是国外流行的一些AGENT工具做了对比,我就想选其中一个任务,让Aipy来执行下,看看效果如何。我选择了“Dify AI投资报告+PPT” 这个任务,提示词用的都是统一的,如下所示。
“Prompt:我是Dify AI的早期投资人,然后我希望做一个深度的投资报告,它现在在两年不到的时间已经成为世界第一,特别是这
个赛道,AI Infa的赛道,我希望你能具体分析它的这个现在产业格局,以及未来的发展潜力,以及其他的Player,例如像lainchain等等。2万字的IC memo,同时生成ppt。” 这个任务在这个测试报告中的难度等级是最高的,达到了5级。
可以先看下五大AGENT工具的执行情况。

(上述图片不知道是否能正常展示)
用Aipy的耗时大概十分钟不到吧,忘了掐秒。确实按照要求生成两两份文档,一份是报告,一份是PPT,但是内容上就非常贫乏了。
Aipy生成的过程中,不停的犯错,然后自我纠正,继续犯错,继续纠正。幸好是最终还是将任务给完成了。虽然内容简陋了些,字数也没有达到要求,和主流AGENT对比还是有一定差距。