撰文|马雪薇GPT-4o、Claude3.5Sonnet等具有视觉能力的大语言模型(LLM),是否能像人类一样感知图像?最新研究表明,在一套人类非常容易完成的7项视觉任务(比如两个圆是否重叠、两条线是...
2024-07-15 508 还不如人类五岁小孩难度为零的视觉测试却挑战失败了
撰文|马雪薇GPT-4o、Claude3.5Sonnet等具有视觉能力的大语言模型(LLM),是否能像人类一样感知图像?最新研究表明,在一套人类非常容易完成的7项视觉任务(比如两个圆是否重叠、两条线是...
2024-07-15 508 还不如人类五岁小孩难度为零的视觉测试却挑战失败了