人工智能

BBC 研究：AI 聊天机器人总结新闻错误百出，分不清事实和观点

2025-02-13 08:27:38人工智能 IT之家远洋

英国广播公司（BBC）近期开展了一项大规模研究，旨在评估人工智能（AI）聊天机器人在新闻总结方面的表现。研究涉及了微软的 Copilot、OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Perplexity 等多款知名 AI 工具。然而，研究结果显示，这些工具在生成新闻总结时存在大量准确性问题。

感谢最新网友咩咩洋的线索投递！

最新 2 月 12 日消息，英国广播公司（BBC）近期开展了一项大规模研究，旨在评估人工智能（AI）聊天机器人在新闻总结方面的表现。研究涉及了微软的 Copilot、OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Perplexity 等多款知名 AI 工具。然而，研究结果显示，这些工具在生成新闻总结时存在大量准确性问题。

研究中，BBC 让这些 AI 工具对 100 篇新闻报道进行总结，并基于总结提出内容相关问题。结果显示，AI 生成的答案中有超过一半存在“显著问题”，其中约五分之一的答案引入了明显的事实错误，这些错误包括数据、陈述和日期等关键信息。BBC 新闻与时事首席执行官德博拉・特内斯（Deborah Turness）指出：“AI 助手在引用 BBC 文章内容时，超过十分之一的‘引文’被篡改或根本不存在于原文中。”

此外，研究还发现，AI 助手在新闻总结时无法区分事实与观点，也无法辨别新闻报道中当下的信息和历史存档的信息，在给出答案的时候还容易掺入主观的观点。特内斯表示：“这些 AI 工具所生成的结果往往是各种问题的混合体，与消费者所期望的经过验证的事实和清晰性相去甚远。”

值得注意的是，BBC 的研究还发现，微软的 Copilot 和谷歌的 Gemini 在处理新闻总结时出现了更复杂的问题，相较于 ChatGPT 和 Perplexity，它们在区分观点与事实、编辑化处理以及遗漏关键背景信息方面表现不佳。

最新注意到，AI 工具的准确性问题并非仅限于这些聊天机器人。苹果公司近期也因旗下 Apple Intelligence 通知工具分享错误标题而引发争议，导致其暂时停用该功能，并遭到新闻机构和自由团体的批评。

BBC 呼吁，在与 AI 服务提供商进行深入对话并找到解决方案之前，应暂停使用 AI 生成的新闻总结。特内斯表示：“我们希望通过合作，共同寻找解决办法。”

赞一个！ ()

计算机科技网

计算机教程网

人工智能

BBC 研究：AI 聊天机器人总结新闻错误百出，分不清事实和观点

李飞飞：未来的历史学家会将当下视为“AI 真正的第一个时代”

Perplexity 推出新版 Sonar 搜索模型：1200 Token / s 疾速，比肩前沿模型

相关文章