img2dataset引发网站所有者担忧,创建者称其在与人工智能崛起作斗争

图片[1]-img2dataset引发网站所有者担忧,创建者称其在与人工智能崛起作斗争-东山笔记

免费AI图片素材获取途径激起了站点运营者和内容制作者的强烈讨论,核心在于数据应用规范同人工智能进步诉求的冲突,这一议题值得仔细研究。

工具介绍

这个免费工具是罗曼·博蒙特制作的,4月26日被站长之家介绍过。它能够自动在网络上搜寻图片资料,用来培养人工智能的图像制造系统。用户借助这个工具,可以自动获取和修改网址清单,搜集图片资料,以便提供给像OpenAI的DALL – E这样的模型。

网站主担忧

很多网站管理者对这种工具感到不安,觉得它随意取得图片和资料,没有征得他们的同意。要是人工智能技术失控,就很容易摆布大量资料,让他们的核心信息和隐私受到损害。一些网站管理者甚至可能都没察觉到这个工具。

图片[2]-img2dataset引发网站所有者担忧,创建者称其在与人工智能崛起作斗争-东山笔记

创建者观点

图片[3]-img2dataset引发网站所有者担忧,创建者称其在与人工智能崛起作斗争-东山笔记

罗曼·博蒙特是个坚定的工具制造者,他的立场十分坚定。他认为网站管理者与人工智能之间的必然冲突非常令人遗憾。他大力宣扬开放型人工智能的巨大能量,指出未来数年间,人们将获得诸多从中获利的可能,尤其是内容生产者,更应及早认识到这一点。

数据来源方式

这个工具会从所有网站搜集图片,前提是网站管理者没有在https头里加上“X – Robots – Tag: noai”之类的标记。网站管理者可以挑选不让它这样干,可很多管理者并不知情,因而没法主动禁止这个工具收录他们站点的信息。

对比谷歌索引

博蒙特为那个工具进行说辞,拿它与谷歌索引网站的情况做类比,说谷歌索引对上网搜索的人有好处。但一些有见识的人指出,网站管理者能从谷歌搜索得到有价值的访问量,谷歌的机器人也依照规则,遵守robots.txt的设定,而那个工具却故意不遵守网站管理者的要求,没给网站管理者带来直接的利益。

未来影响思考

这个工具所引起的讨论,实际上揭示了人工智能领域里关于数据应用的一个困境。人工智能的进步,依靠海量的信息作为基础;与此同时,网络站点的经营者的正当权利也应当得到维护。倘若不能妥善解决这一冲突,不仅会阻碍人工智能的持续进步,同时也会损害网络站点的经营效益。

对于人工智能快速进步的情况,怎样兼顾站点管理者的合法权利和人工智能对信息的使用要求?希望大家可以支持这篇文章,转发出去,同时在留言区发表看法。

© 版权声明
THE END
喜欢就支持一下吧
分享