当前位置: 首页 » 产品 » 机械设备 » 正文

Meta尝试了一个新的、更“包容”的人工智能训练数据集

放大字体  缩小字体 发布日期: 2025-03-16 13:55   来源:http://www.baidu.com/  作者:无忧资讯  浏览次数:15
核心提示:随着OpenAI的ChatGPT和谷歌的Bard等公司的出现,科技行业的领导者们正在继续向消费者推广他们的人工智能系统(有时会引起争议)以

me<em></em>ta logo on smartphone resting atop glowing keyboard

随着OpenAI的ChatGPT和谷歌的Bard等公司的出现,科技行业的领导者们正在继续向消费者推广他们的人工智能系统(有时会引起争议)以及与人工智能集成的产品。尽管如此,许多隐私倡导者和技术专家仍然对用于训练此类程序的海量数据集感到担忧,特别是涉及到用户的数据同意和补偿、信息准确性,以及算法强制的种族和社会政治偏见等问题。

meta希望通过周四发布的Casual Conversations v2来帮助缓解这些担忧,这是其2021年人工智能视听训练数据集的更新。根据该公司的声明,在11月公开的文献综述的指导下,这些数据对不同地理、文化、种族和身体特征的人类受试者进行了更细致的分析。

meta states v2是“一个更具包容性的衡量公平性的数据集”,它来自七个国家录制的26467段视频独白,由来自巴西、印度、印度尼西亚、墨西哥、越南、菲律宾和美国的5567名付费参与者提供,他们还提供了包括年龄、性别和外貌在内的自我识别属性。尽管Casual Conversations最初发布的视频超过4.5万段,但它们是从居住在美国的3000多人中抽取的,并且通过更少的指标进行自我识别。

长期以来,人工智能产品一直受到种族主义、性别歧视和其他不准确反应的困扰,解决人工智能中的算法偏见是这个行业的一个重要障碍。这在很大程度上取决于如何创建、培养算法并将其提供给开发人员。

尽管meta认为《Casual Conversations v2》是向前迈出的重要一步,但专家们仍持谨慎乐观态度,并敦促继续对硅谷似乎轻率地进入人工智能驱动的生态系统进行审查。

西北大学(Northwestern University)计算机科学教授、该校机器智能安全促进中心主任克里斯蒂安·哈蒙德(Kristian Hammond)在一封电子邮件中写道:“在这个领域,几乎任何东西都是一种进步。”Hammond认为meta更新的数据集对公司来说是“坚实的一步”,尤其是考虑到过去的隐私争议,并认为其对用户同意和研究参与者的劳动补偿的强调尤为重要。

“但改善并不是完全的解决方案。只是一步,”他警告说。

对于哈蒙德来说,一个主要的问题仍然是,研究人员究竟是如何招募参与者来制作Casual Conversations v2的。他写道:“性别和种族多样性固然好,但你也必须考虑收入和社会地位的影响,以及种族更细致的方面。任何自我选择的人群都可能产生偏见。”

当被问及如何选择参与者时,meta公司人工智能通信团队的Nisha Deo通过电子邮件表示:“我可以告诉大家,我们聘请了符合我们要求的外部供应商来招募参与者,”补偿费率由这些供应商“考虑到该地区数据收集的市场价值”决定。

当被要求提供有关薪酬的具体数字时,meta表示“不可能在我们已经分享的基础上再扩大。”

然而,Deo补充说,meta故意在数据培养的每一步中纳入了“负责任的机制”,包括与香港科技大学的学术伙伴合作,对现有数据集方法进行全面的文献综述,以及注释者的全面指南。她继续说道:“负责任的人工智能在构建这个系统时考虑到了道德因素和公民权利,并将其作为一种资源开放,以提高人工智能的包容性。”

对于哈蒙德这样的行业观察人士来说,像Casual Conversations v2这样的改进是受欢迎的,但还需要做更多的工作,尤其是当世界上最大的科技公司似乎正在进入一场人工智能军备竞赛的时候。“每个人都应该明白,这不是完全的解决方案。这只是第一步,”他写道。“我们必须确保我们不会过于关注这一显而易见的步骤……我们停止刺探组织,以确保他们没有在未经同意的情况下收集数据。”

cript type="text/javascript">
内容来源:https://www.16jixie.com/news/show-3657.html
 
 
[ 产品搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 违规举报 ]  [ 关闭窗口 ]

 

 
 
    行业协会  备案信息  可信网站