该研究仅评估了公开可用的大语言模型(如ChatGPT、Claude、Gemini),而未包括其他专为医疗或视觉任务优化的模型。这些模型可能并非专门为认知任务设计,从而限制了结论的广泛适用性。
教科书出版商麦格劳-希尔公司(McGraw Hill)常常要在两种不同观点之间找到平衡。该公司首席数据科学和人工智能官迪伦·阿雷纳(Dylan Arena)认为,这个历史可以追溯到计算器被发明出来的时候。