哈佛大学、谷歌发布100万本公共领域书籍,为AI训练提供合法数据

gege882024-12-13 09:31:39IT之家

12 月 13 日消息,据 TechCrunch 12 日报道,哈佛大学与谷歌宣布,联合发布 100 万本公共领域书籍作为 AI 训练数据集。

AI 训练所需的数据成本高昂,但却更适合资金充裕的科技公司。因此,哈佛大学计划发布一个包含约 100 万本公共领域书籍的数据集,这些书籍覆盖多种类型、语言和作者,包括已不再受版权保护的经典作家如狄更斯、但丁和莎士比亚等,因这些作品的版权已随时间过期。

虽然这个新数据集尚未公开,也不清楚具体的发布方式和时间,但它来源于谷歌的长期项目 —— 谷歌图书(Google Books)。因此,谷歌将参与这次“宝贵财富”的广泛发布。

据了解,早在今年 3 月,哈佛大学就曾透露其“机构数据计划(IDI)”,并表示这一计划旨在为 AI 提供“合法数据的可信通道”。直到正式启动后,该计划才确认得到了微软和 OpenAI 的资金支持。

IDI 的执行董事格雷格・莱佩特(Greg Leppert)表示,该数据集的目标是“让竞争环境更加公平”,通过向包括研究机构和 AI 初创公司在内的各类机构开放这一庞大的数据集,以帮助他们训练大型语言模型。(清源)

OpenAI首个视频生成模型发布:允许制作长达一分钟视频

2月16日消息,OpenAI近日发布了Sora模型,可以根据用户输入的文本描述,生成一段视频内容。该模型可以深度模拟真实物理世界,标志着人工智能在理解真实世界场景并与之互动的能力方面实现了重大飞跃。Sora会严格根据...

视觉智驾方案小鹏P7+首秀亮相 号称30万内最大空间的轿跑

10月10日消息,今日,小鹏汽车全球首款AI汽车——小鹏P7+于深圳全球首秀亮相。小鹏汽车董事长CEO何小鹏表示,小鹏P7+自诞生之初便肩负两大使命:让更多普通人感受到豪华行政级的空间与舒适,让更多燃油车用户体验到...

AI电力需求激增,美国新增发电量创21年来新高

8月20日消息,今年上半年,美国电力开发商大幅增加了发电容量,以应对由数据中心和人工智能驱动的电力需求增长,这是二十多年来的最大增幅。美国能源信息署周一发布的最新报告指出,今年上半年,美国电力开发商为满...

AI智变千行百业,量子位智库发布《2024年度AI十大趋势报告》

今日,量子位智库发布的《2024年度AI十大趋势报告》,该报告不仅深入剖析AI这一前沿科技如何迭代技术能力、重塑商业版图、引领产业升级,还敏锐洞察变革趋势,对未来路径进行前瞻性展望。《2024年度AI十大趋势报告》...

谷歌发布能力最强AI模型Gemini:性能碾压GPT4 语言理解超人类

12月7日消息,北京时间7日凌晨,Google公司突然放出了自己“迄今为止最强大、最通用的模型”Gemini。Gemini是一款多模态模型,可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频...

TAG:谷歌 AI
上一篇:高通技术公司首席技术官明年换帅,将聚焦6G和AI
下一篇:AMD与微软强强携手,开启 Windows 11 AI+ PC新时代!