IT之家 2 月 12 日消息,英国广播公司(BBC)近期开展了一项大规模研究,旨在评估人工智能(AI)聊天机器人在新闻总结方面的表现。研究涉及了微软的 Copilot、OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Perplexity 等多款知名 AI 工具。然而,研究结果显示,这些工具在生成新闻总结时存在大量准确性问题。 研究中,BBC 让这些 AI 工具对 100 篇新闻报道进行总结,并基于总结提出内容相关问题。结果显示,AI 生成的答案中有超过一半存在“显著问题”,其中约五分之一的答案引入了明显的事实错误,这些错误包括数据、陈述和日期等关键信息。BBC 新闻与时事首席执行官德博拉・特内斯(Deborah Turness)指出:“AI 助手在引用 BBC 文章内容时,超过十分之一的‘引文’被篡改或根本不存在于原文中。” 此外,研究还发现,AI 助手在新闻总结时无法区分事实与观点,也无法辨别新闻报道中当下的信息和历史存档的信息,在给出答案的时候还容易掺入主观的观点。特内斯表示:“这些 AI 工具所生成的结果往往是各种问题的混合体,与消费者所期望的经过验证的事实和清晰性相去甚远。” 值得注意的是,BBC 的研究还发现,微软的 Copilot 和谷歌的 Gemini 在处理新闻总结时出现了更复杂的问题,相较于 ChatGPT 和 Perplexity,它们在区分观点与事实、编辑化处理以及遗漏关键背景信息方面表现不佳。 IT之家注意到,AI 工具的准确性问题并非仅限于这些聊天机器人。苹果公司近期也因旗下 Apple Intelligence 通知工具分享错误标题而引发争议,导致其暂时停用该功能,并遭到新闻机构和自由团体的批评。 BBC 呼吁,在与 AI 服务提供商进行深入对话并找到解决方案之前,应暂停使用 AI 生成的新闻总结。特内斯表示:“我们希望通过合作,共同寻找解决办法。”(IT之家) 版权声明
“特别声明:以上作品内容(包括在内的视频、图片或音频)为用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user , the platform merely provides information storage space services.”
|
|联系我们|法律声明|用户协议|AMT咨询|商务合作|会员入驻|积分充值|积分商城|积分奖励规则|TradEx全球购|加入QQ技术群|添加企业微信|加入微信技术群|文章投稿|手机版|小黑屋|
世界先进制造技术论坛™(简称AMT™, 制造知网™)
( 沪ICP备12020441号-3 )
GMT+8, 2025-4-30 14:00 , Processed in 0.018596 second(s), 18 queries , Redis On.
论坛声明: 世界先进制造技术论坛(制造知网) 属纯技术性论坛,我们严格遵守《中华人民共和国网络安全法》、《个人信息保护法》等国家相关法律法规,请勿发布非法言论、非法广告等信息,多谢合作。
本论坛言论纯属发表者个人意见且会员单独承担发表内容的法律责任,与本论坛立场无关;会员参与本论坛讨论必须遵守中华人民共和国法律法规,凡涉及政治言论、色情、毒品、违法枪支销售等信息一律删除,并将积极配合和协助有关执法机关的调查,请所有会员注意!
本论坛资源由会员在本论坛发布,版权属于原作者;论坛所有资源为会员个人学习使用,请勿涉及商业用途并请在下载后24小时删除;如有侵犯原作者的版权和知识产权,请来信告知,我们将立即做出处理和回复,谢谢合作!
合作联系: 双日QQ客服:3419347041 单日QQ客服:3500763653 电话021-37709287 合作问题投诉:QQ:2969954637 邮箱:info@amtbbs.org 微信公众号:AMTBBS