谷歌拉响通用人工智能警报,首次公开 AI 安全防御蓝图
4 月 4 日消息,科技媒体 WinBuzzer 昨日(4 月 3 日)发布博文,报道称谷歌旗下 DeepMind 最新发布全球 AGI(通用人工智能)安全框架,呼吁在技术失控前建立跨国防护机制。
DeepMind 认为 AGI 即将落地,主张立即行动。AGI 可能将在未来数年实现人类级认知能力,其自主决策特性可能加速医疗、教育等领域的突破,但滥用、目标错位等风险亦需警惕。
谷歌 DeepMind 发布《技术性 AGI 安全与保障方法》白皮书,提出应对通用人工智能(AGI)潜在风险的系统性方案。
援引博文介绍,报告聚焦四大风险领域(滥用、错位、事故、结构性风险),提出通过安全机制设计、透明化研究及行业协作降低危害。
而目标错位是 AGI 核心风险之一。当 AI 为完成任务采取非常规手段(如入侵订票系统获取座位),即产生与人类意图的偏差。DeepMind 通过“放大监督”技术训练 AI 识别正确目标,并利用 AI 自评(如辩论机制)提升复杂场景下的判断力。
DeepMind 提出的国际安全框架摒弃抽象伦理讨论,聚焦技术快速演进中的实际问题,包括组建类似核不扩散条约的跨国评估机构、设立国家级 AI 风险监测中心等。
谷歌 DeepMind 提出强化技术研究、部署预警系统、通过国际机构协调治理三大支柱方案,强调当前亟需限制 AI 网络攻击等危险能力。
DeepMind 的倡议并非孤立行动。竞争对手 Anthropic 于 2024 年 11 月警告需在 18 个月内遏制 AI 失控,并设置能力阈值触发保护机制;Meta 在 2025 年 2 月推出《前沿 AI 框架》,停止公开高危模型。
安全防护已延伸至硬件领域。英伟达 2025 年 1 月推出 NeMo Guardrails 微服务套件,实时拦截有害输出,目前应用于医疗、汽车等行业。(故渊)
外媒称ChatGPT日耗电超过50万度 相当于数万家庭日常用电量3月11日消息,据外媒报道,在OpenAI训练的人工智能聊天机器人ChatGPT大火之后,谷歌、Meta等科技巨头们加大了在生成式人工智能研发和应用领域的投入,这也给诸多领域带来了新的发展机遇,尤其是提供算力支持的芯片,...
中国AI出海须防“TikTok式危机”“我们的目标是星辰大海”,这句出自田中芳樹的著名太空歌剧《银河英雄传说》的话,是很多创业者喜欢的口头禅。这话激励了人们投身广阔而未知的海外市场。尤其是国内市场高度内卷,只要一个生意能赚钱,一大批同行竞...
美国发布新禁令!限制投资中国AI技术和产品快科技6月23日消息,据媒体报道,美国财政部近日宣布了一项新的禁令,旨在限制美国人对中国在人工智能(AI)和芯片领域的投资。这项禁令是继2023年8月总统签署的行政命令后的具体实施步骤,目的是防止美国资金帮助中...
Meta今年人工智能相关支出要增加数十亿美元4月25日消息,当地时间周三,Facebook的母公司Meta公布了第一季度财报,显示公司营收同比增长27%,利润更是翻了一番多。公司表示,为了支持人工智能领域的发展,计划在基础设施方面的投入将超出预期,增加数十亿美元...
“中国AI巨头”李一舟翻车?AI课全网下架 陷“割韭菜”争议2月23日消息,这几天,Sora火了,尽管尚未开启公测,“第一拨靠Sora赚钱的人已经出现”便登上热搜,这其中就有“AI卖课巨头”李一舟。飞瓜数据显示,此前李一舟售卖的AI课一年内卖出约25万套,销售额最高达5000万元...
外媒:苹果正在全球范围内寻找生成式人工智能人才
8月7日消息,据外媒报道,苹果公司正在全球范围内寻找生成式人工智能(AI)人才。随着OpenAI旗下AI聊天机器...
苹果计划使用富士康供应的专用服务器测试人工智能服务
据udn援引南华早报的消息,富士康将独家向苹果供应用于训练和测试人工智能服务的专用服务器。由于苹果计划...
外媒称苹果将采用富士康服务器训练和测试人工智能服务
8月9日消息,据外媒报道,在OpenAI训练的人工智能聊天机器人ChatGPT大火之后,谷歌等多家公司加入了生成式...
英伟达在人工智能技术领域的领导地位和近乎垄断的地位「令人震惊」
英伟达日前展示了其新的人工智能处理器芯片GH200,并推出了AIWorkbench功能,供客户开发自己的大型语言模型...