欢迎来到进口食品商务网!

人权组织称,数据集中使用了澳大利亚儿童的照片来训练人工智能

2024-07-03 12:51 来源:得道网

人权观察组织(HRW)的研究发现,一些人工智能图像生成工具在未经儿童或其家人知情或同意的情况下,将澳大利亚儿童的照片包含在数据集中。

对Laion-5B数据集中包含的58.5亿张图片中不到0.0001%的图片进行了分析,发现从互联网上抓取了190张澳大利亚儿童的照片。Laion-5B数据集由Stable Diffusion的创建者Stability AI和Midjourney等服务使用。

Laion-5B是通过从互联网上抓取照片构建的。总部位于德国的Laion并没有保存从互联网上抓取的所有图像的存储库,但它包含了原始图像的url列表,以及这些链接图像上包含的替代文本。

人权观察发现,数据集中的儿童图像很容易识别,其中一些名字包含在随附的标题或存储图像的URL中。

它还包括照片拍摄的时间和地点的信息。

人权观察称,其中一张照片显示,两个男孩站在一幅彩色壁画前,壁画上显示了他们的名字、年龄和就读的幼儿园,这些信息在互联网上其他任何地方都找不到。

人权观察的儿童权利和技术研究员韩慧贞(Hye Jung Han)告诉澳大利亚《卫报》,这些照片是从照片和视频分享网站以及学校网站上删除的。

  • 注册澳大利亚卫报免费的上午和下午的电子邮件时事通讯,获取每日新闻综述

她说:“这些在学校网站上不容易找到。”“他们可能是在拍摄学校活动、舞蹈表演或游泳比赛的照片,想要一种与父母和孩子分享这些照片的方式。

“这不是他们网站上受密码保护的部分,但这是网站上不公开访问的一部分,除非你收到链接。

“这些都不是谷歌索引的网页。”

阅读更多

人权观察还在数据集中发现了一段未列入名单的YouTube上的学校庆祝视频。他说,这样的视频在YouTube上是无法搜索到的,从YouTube上抓取是违反其政策的。

还发现了土著儿童的照片,其中一些是十多年前的照片。韩表示,这引发了一个问题,即如果将最近去世的土著居民的图像包含在用于训练人工智能的数据集中,如何保护这些图像。

我们联系了开源数据集背后的组织Laion,请其发表评论。

该组织有一个表单,用户可以在其中提交对数据集中问题的反馈。据人权观察报道,莱昂上个月证实了个人照片的存在,并承诺将删除这些照片,但他表示,从互联网上删除个人照片的最终责任在于孩子和他们的监护人。

韩表示,这种做法可能会伤害到两类孩子——那些照片被刮掉的孩子;以及那些可能拥有恶意人工智能工具的人,比如基于数据集构建的深度伪造应用程序,被用来对付他们。

她说:“几乎所有这些免费的裸体应用程序都是在Laion-5B上开发的,因为它是最大的图像、文本和训练数据集。”

“它被无数的人工智能开发者使用,其中一些应用程序专门用来伤害儿童。”

上个月,一名十几岁的男孩被捕后被释放,因为人工智能用巴克斯·马什文法学院约50名女学生的肖像制作的裸照在网上流传。

阅读更多

今年6月,联邦政府出台了禁止制作和分享深度伪造色情内容的立法,但人权观察组织认为,这未能解决更深层次的问题,即儿童的个人数据没有受到保护,不会被滥用,包括在深度伪造中使用真实儿童的肖像。

“没有人知道明天人工智能将如何发展。我认为危害的根源在于儿童的个人数据不受法律保护,因此他们无法免受任何行为者或任何类型的技术的滥用。”

该组织表示,这应该在立法中得到解决,以更新《隐私法》,预计将于8月出台。人权观察表示,这应该禁止将儿童数据收集到人工智能中,并禁止未经同意的数字复制或操纵儿童的肖像。

澳大利亚隐私专员在2021年发现,明视人工智能公司使用面部识别技术从社交媒体上抓取图像“可能对所有澳大利亚人的个人自由产生不利影响”,该公司侵犯了澳大利亚人的隐私。

韩说,这是一个强有力的声明,但现在需要法律和法律的执行来支持。

“还有很长的路要走。”

中国进口商网声明:未经许可,不得转载。
热门产品招商