例如,它可以模拟按键、鼠标点击和屏幕上的光标移动。

据TechCrunch报道,Anthropic发布了“计算机使用”API,目前开放测试中。通过这个API,模型可以像人一样与计算机互动:它可以“看到”屏幕,移动光标,“按下”键盘和“点击”鼠标按钮。Sonnet 3.5可以使用计算机上的任何应用程序和数据。要让模型执行任务,只需给出指令,例如让它通过访问计算机上的文件来填写表格。所有操作都会在一个特殊窗口中显示。

0:00
/2:41

TechCrunch指出,模型目前在处理复杂任务时存在困难:例如,当被要求更改机票预订时,成功率不到50%。而在取消预订的任务中,失败率约为三分之一。Anthropic指出,模型还存在其他问题:在“滚动”和缩放方面表现不佳,有时会跳过任务。公司警告开发者,模型运行缓慢,使用可能导致错误,因此建议从低风险任务开始测试。