400 128 6709

行业新闻

为了避免人工智能可能带来的灾难,我们要向核安全学习

发布时间:2023-06-11点击次数:

在最近几周,有一群声音很响的专家主宰了围绕人工智能的讨论。据他们所说,我们有可能创建一种人工智能系统,日后它可能会变得极其强大,甚至能够灭绝人类。

最近,一群科技公司领导者和人工智能专家发布了另一封公开信,他们宣称,降低人工智能导致人类灭绝的风险,应该与预防流行病和核战争一样,成为全球的优先事项。已经有超过30000人签署了第一份关于暂停人工智能开发的请愿书,其中包括许多在人工智能领域杰出的专家。

那么,科技企业该做什么才能让人类避免被人工智能毁灭呢?最新的一个建议来自牛津大学、剑桥大学、多伦多大学、蒙特利尔大学、谷歌 DeepMind、OpenAI、Anthropic、几家人工智能研究非营利组织和图灵奖得主约书亚·本希奥(Yoshua Bengio)的研究人员的一篇新论文。

他们建议,人工智能开发人员应该在开发的早期阶段,甚至在开始任何训练之前,评估模型造成“极端风险”的潜力。风险包括人工智能模型操纵及欺骗人类,以及获取武器或发现可利用的网络安全漏洞。

这个评估过程可以帮助开发人员决定是否继续使用这个模型。如果风险被认为太高,该组织建议暂停开发,直到风险得到缓解。

该论文的主要作者、DeepMind 的研究科学家托比•舍夫兰(Toby Shevlane)表示:“正在推进前沿领域的领先人工智能公司有责任关注新出现的问题,并尽早发现它们,以便我们能够尽快解决这些问题。”

据舍夫兰所言,人工智能开发者应该进行技术测试,以便了解模型的潜在危险能力,并确认它是否有利用这些能力的趋势。

游戏名为“让我说(make me say)”,用以测试人工智能语言模型是否具有操纵人的能力。在游戏中,模型会试图让人类猜测一个特定的单词,例如“长颈鹿”,而人类并不事先知道这个单词。然后,研究人员测量该模型成功的频率。

人们可以为不同的、更危险的能力创建类似的任务。舍夫兰说,希望开发人员能够建立一个详细的、描述模型运行情况的总览,这将使研究人员能够评估模型在错误的人手中会做出什么。

下一步是让外部审计人员和研究人员评估人工智能模型在部署前后的风险。虽然科技公司开始认识到外部审计和研究是必要的,但对于外部人员完成这项工作到底需要多大程度的访问权限,存在不同的观点。

舍夫兰并没有建议人工智能公司让外部研究人员完全访问数据和算法,但他表示,人工智能模型需要尽可能多的审查。

网络安全研究和咨询公司 Trail of Bits 负责机器学习保障的工程总监海蒂•赫拉夫(Heidi Khlaaf)表示,即使是这些方法也“不成熟”,远远不够严谨且无法解决问题。在此之前,她的工作是评估和核实核电站的安全性。

Seede AI Seede AI

AI 驱动的设计工具

Seede AI 713 查看详情 Seede AI

赫拉夫指出,从80多年来有关核武器安全研究和风险缓解的经验中汲取教训,对人工智能领域将有所裨益。她表示,这些严苛的检测措施并非出于利润考虑,而是为应对一种非常紧迫的生存威胁而实施的。

她说,在人工智能领域,有很多将其与核战争、核电站和核安全相提并论的文章,但这些论文中没有一篇提到核法规或如何为核系统构建软件。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

为了避免人工智能可能带来的灾难,我们要向核安全学习 (来源:STEPHANIE ARNETT/MITTR | ENVATO)

人工智能社区可以从核风险中学到的最重要一件事是可追溯性:将每一个动作和组成部分放在放大镜下进行细致的分析和记录。

例如,核电厂有数千页的文件来证明该系统不会对任何人造成伤害,赫拉夫说。人工智能开发的开发人员刚刚开始将描述模型表现的段落拼接起来。

“你需要有一种系统的方式来应对风险。你不能抱着一种心态:‘哦,这可能会发生,让我把它写下来。’”她说。

舍夫兰说,这些是可以共存的。“我们的目标是,该领域将有许多涵盖广泛风险的、优秀的模型评估方法……模型评估是良好治理的核心(但远不是唯一)工具。”

目前,人工智能公司甚至没有全面了解训练其算法的数据集,他们也没有完全理解人工智能语言模型是如何产生结果的。舍夫兰认为,这种情况应该改变。

“帮助我们更好地理解特定模型的研究,可能会帮助我们更好地应对一系列不同的风险,”他说。

如果忽略基本面和看似较小的问题,而只关注极端风险,可能会产生复合效应,进而带来更大的危害。赫拉夫说:“我们是在连爬都不会的情况下试图学会跑步。”

支持:Ren

以上就是为了避免人工智能可能带来的灾难,我们要向核安全学习的详细内容,更多请关注其它相关文章!


# 她说  # 网站建设与推广认可l火17星热情  # 烟台关键词排名费用  # 泰州营销型网站建设方案  # 福建技术网站推广多少钱  # 法库市场网站建设概况  # 线下活动行业网站建设  # 扬州住房和城乡建设网站  # 镇海网站霸屏推广  # 郑州专业网站推广价格表  # seo营销找火星  # 到你  # 人工智能  # 腾讯  # 太多  # 丰田  # 为了避免  # 要向  # 本田  # 拉夫  # 开发人员  # 核安全  # 灾难 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: AI生成新闻网站数量激增,正在疯狂赚取广告收入  用AI技术点亮老照片:Deep Nostalgia带给照片新生动感  Midjourney创始人:AI应该成为人类思想的延伸  MetaGPT开源框架爆红 GitHub,达到1.1万星,模拟软件开发流程  真全息产品,亮相深圳文博会——dipal数伴拓展元宇宙非沉浸式体验  第四范式「式说」大模型入选《2025年通用人工智能创新应用案例集》  探展WAIC |万向区块链杜宇:不存在单一技术的iPhone时刻,Web3.0核心将基于AI+区块链+物联网  学而思网校推出首个基于自研大模型的《人工智能第一课》  Databricks 发布大数据分析平台 Spark 用 AI 模型 SDK:一键生成 SQL 及 FySpark 语言图表代码  热点 | 人工智能黄金时代开启  智能电网技术:提高能源效率和可靠性  ChatGPT会成为你家新的语音助手吗?  讯飞听见会写“会议摘要”功能全面升级,AI更懂你的关注点  中国电信AI能力通过国家级金融领域权威认证并荣膺AI国际头部竞赛冠军  破解零碳产业园建设规范和成果评价难题  北京市通用人工智能产业创新伙伴计划名单公布,京东科技入选“算力伙伴”  美图第二届影像节发布七款AI影像创作工具  清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳  全新“AI助手”!讯飞星火助手中心人机协作共创新生态  Goodnotes 6推出,带来多项全新AI功能,让电子笔记更智能  找对了风口想不火都难,乐天派机器人,安卓机器人的最终形态?  自动驾驶汽车避障、路径规划和控制技术详解  百亿量化私募:量化投资进入“精耕细作”时代 AI带来行业新变革  全新升级的广州麦当劳:面积最大餐厅正式引入智慧机器人  人工智能如何与智能家居集成  城市在采用人工智能方面进展如何?  中兴通讯无人机高空基站助力北京门头沟受灾乡镇保障应急通信  联想首发AI PC于今年秋季,英特尔CEO确认AI PC时代来临  午报 | 字节跳动要造机器人;东方甄选首次启动自有APP|直播|  如何用AI重塑你的工作流(一)  DreamAvatar数字人在哪里下载  全国体育人工智能大会举办,专家聚焦体育人工智能领域人才培养  AI创作广告文案等同2.47年工作经验,且消费者无法区分|AI营销前沿  小米又拿下国际比赛第一:AI翻译立功  数字文明尼山对话 | 在东方圣城与AI潮流梦幻联动,看“智慧大脑”让数字山东更美好  昌吉市利用无人机实现全天候河道动态巡检  云南首例达芬奇机器人微创心脏手术成功开展  美图秀秀发布7款AI产品:支持用户创作、商业创作  1分钟做出苹果Vision Pro「官网」?上班8小时搞出480个网页,同事被卷疯了  AI+音乐如何“生成”动听旋律?一起揭秘世界人工智能大会开场曲  美图公司:Wink国内首发AI画面拓展功能  微软向美国政府提供GPT大模型,如何保证安全性?  新华全媒+|AI:当心,我可能欺骗了你!  BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」  美军AI无人机“误杀”操作员,人工智能要在军事领域毁灭人类?  生成式AI引路产业加速来袭,微美全息探索“AIGC+虚拟人”融合应用  苹果CEO库克:持续研究生成式人工智能技术  IBM CEO克里希纳:人工智能潜在创新无法被监管  鉴智机器人发布基于地平线征程5的标准视觉感知产品  Prompt解锁语音语言模型生成能力,SpeechGen实现语音翻译、修补多项任务 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司