研究:人工智能模型难以识别废话

     在巴黎,9月15日——周四发布的一项研究显示,支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。...

  Study: AI models struggle to identify nonsense

  在巴黎,9月15日——周四发布的一项研究显示,支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。

  来自美国哥伦比亚大学的研究团队指出,他们的研究揭示了当前人工智能模型的局限性,并警告在法律或医疗领域使用这些模型仍为时尚早。

  研究人员对9种人工智能模型进行了测试,向它们提供了数百对句子,并询问哪些句子可能在日常交流中出现。

  此外,他们还让100名参与者对几对句子进行相同的判断,例如:“一个买家也可以拥有正品/一个精通高中圆周的人我漫步。”

  这项研究发表在《自然机器智能》期刊上,研究团队将人工智能的判断与人类的判断进行了比较,发现了显著的差异。

  像GPT-2这样的复杂模型,作为病毒式聊天机器人ChatGPT的早期版本,通常能与人类的回答相匹配。

  然而,其他一些较简单的模型表现则不尽如人意。

  研究人员强调,所有模型都存在错误。

  该报告的作者之一、心理学教授克里斯托弗·巴尔达萨诺(Christopher Baldassano)表示:“每个模型都显示出盲点,将一些人类参与者认为是无意义的句子标记为有意义的。”

  他补充道:“这应该促使我们深思,人工智能系统在多大程度上能够做出重要决策,至少在目前是这样。”

  论文的另一位作者塔尔·戈兰告诉法新社,这些模型是一项“令人兴奋的技术,可以极大地增强人类的生产力”。

  然而,他认为,“让这些模型在法律、医学或学生评估等领域取代人类决策可能为时尚早”。

  他说,潜在的陷阱之一是,人们可能会故意利用模型的盲点进行操控。

  随着ChatGPT的发布,人工智能模型在去年突然进入公众视野。自那时起,ChatGPT通过了各种考试,并被誉为医生、律师及其他专业人士的潜在助手。(法新社)

本文来自作者[admin]投稿,不代表xfqse号立场,如若转载,请注明出处:https://xfqse.cn/cskp/202506-429.html

(11)

文章推荐

  • 莱昂纳多·迪卡普里奥在“吹牛老爹”肖恩·库姆斯的丑闻中澄清了真相

      据报道,莱昂纳多·迪卡普里奥与“吹牛老爹”肖恩·库姆斯在严重的法律纠纷中没有任何关系。最近,一张迪卡普里奥1998年在“老爹”臭名昭著的“白色派对”上的照片重新浮出水面,这让人们对他与这位说唱歌手的关系产生了质疑,后者已被指控性交易。然而,一位与这位《泰坦尼克号》演员关系密切的消息

    2025年06月13日
    7
  • 美国总统拜登又一次失态:忘了在四方会议上介绍莫迪总理

    剧情简介美国总统乔·拜登又经历了短暂的失败周日在特拉华州举行的四方会议上,他暂时忘记在舞台上介绍印度总理纳伦德拉·莫迪。乔·拜登总统和纳伦德拉·莫迪总理在特拉华州格林维尔(图片来源:ANI)美国总统乔·拜登(JoeBiden)又一次陷入困境周日在特拉华州举行的四方会议上,他暂时

    2025年06月14日
    9
  • 澳大利亚试管婴儿双胞胎和三胞胎的出生率直线下降,专家们非常兴奋

      在澳大利亚,双胞胎和三胞胎的试管婴儿出生率达到了历史最低点,这一消息令生育专家们感到振奋。新南威尔士大学的医学研究团队发布的报告显示,试管受精后多胞胎母亲的比例降至历史新低,仅为2.7%。乔治娜·钱伯斯教授在接受9News采访时表示,这是澳大利

    2025年07月03日
    9
  • 谢赫·穆罕默德总统访问华盛顿国家儿童医院

      周日,谢赫·穆罕默德总统参观了位于华盛顿的国家儿童医院,并听取了该医院专科部门的介绍。这次访问包括参观谢赫扎耶德儿科外科创新研究所。据国家新闻机构Wam报道,谢赫穆罕默德向其展示了用于治疗患者的技术和创新。其中一项创新是婴儿微型起搏器,于2019年首次向谢赫·穆罕默德(Sheikh

    2025年07月06日
    9
  • 西澳的罗特内斯特岛欢迎新的工人住宿

    作为西澳最受欢迎的岛屿度假胜地,罗特尼斯在上个财政年度迎来了巨大的游客热潮,有近10万人前往罗特尼斯。随着州政府准备将罗特尼斯岛的新工人住宿转移到下一阶段,周一发布的新数据显示,该岛在2023-24年接待了82.3万名游客。这比截至去年6月的12个月里的

    2025年07月12日
    9
  • 热刺两度后来后去,阻击曼联

      曼联2托特纳姆热刺2埃里克·黑格在新教练吉姆·拉特克利夫爵士的带领下,在对阵热刺的比赛中以一场有趣的平局开始了他的试训,他不得不接受一分。霍吉伦德和拉什福德的进球让红魔占据了主导地位,拉特克利夫在圣诞节前购买了俱乐部25%的股份,这是他第一次

    2025年07月12日
    11
  • 随着以色列表示愿意战斗数月甚至更长时间来击败哈马斯,战斗在加沙地区展开

    周日,以色列表示,它准备战斗数月或更长时间,以击败该地区的哈马斯统治者。一名重要的调解人表示,讨论停火的意愿正在减弱。在亲密盟友美国的外交支持和武器支持下,以色列发动的军事进攻造成数千名巴勒斯坦平民死亡,以色列因此受到国际社会的愤怒。加沙230万人口中约有90

    2025年07月25日
    11
  • 马丁·刘易斯的汽油和柴油泵“让燃料更便宜”

    金融专家马丁·刘易斯(MartinLewis)分享说,许多人认为可以免费获得额外燃料的普遍建议并不完全正确。虽然RAC预测汽油和柴油的价格在未来几个月将会下降,但没有一个驾车者愿意在加油站浪费钱。然而,马丁·刘易斯在他的省钱专家网站上强调,晚上加油不太

    2025年07月26日
    13
  • 查到实测辅助“震动鞋垫作弊长牌”教你开挂详细

    震动鞋垫作弊长牌是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。手机打牌可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义手机打牌系统规律,只需要输入自己想要的开挂功能,一键便可以生成出手机

    2025年07月29日
    12
  • 以色列因军队进驻加沙而加大地下血库的处理力度,面对前所未有的血液需求

    拉姆拉,以色列(美联社)——10月7日,哈马斯武装分子袭击以色列南部数小时后,该国新建的地下血库开始运作。工作人员将设备搬进地下掩体,开始拯救生命。位于特拉维夫附近拉姆拉的马库斯国家血液服务中心原定在几天内开放,但自从哈马斯袭击以来,以色列有1400多人丧生,其中

    2025年07月29日
    8

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年06月16日

    我是xfqse号的签约作者“admin”!

  • admin
    admin 2025年06月16日

    希望本篇文章《研究:人工智能模型难以识别废话》能对你有所帮助!

  • admin
    admin 2025年06月16日

    本站[xfqse号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • admin
    admin 2025年06月16日

    本文概览:     在巴黎,9月15日——周四发布的一项研究显示,支撑聊天机器人及其他应用的人工智能模型在区分无意义的内容与自然语言方面仍然面临挑战。...

    联系我们

    邮件:xfqse号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们