Meta尝试了一个新的、更“包容”的人工智能训练数据集

me<em></em>ta logo on smartphone resting atop glowing keyboard

随着OpenAI的ChatGPT和谷歌的Bard等公司的出现，科技行业的领导者们正在继续向消费者推广他们的人工智能系统(有时会引起争议)以及与人工智能集成的产品。尽管如此，许多隐私倡导者和技术专家仍然对用于训练此类程序的海量数据集感到担忧，特别是涉及到用户的数据同意和补偿、信息准确性，以及算法强制的种族和社会政治偏见等问题。

meta希望通过周四发布的Casual Conversations v2来帮助缓解这些担忧，这是其2021年人工智能视听训练数据集的更新。根据该公司的声明，在11月公开的文献综述的指导下，这些数据对不同地理、文化、种族和身体特征的人类受试者进行了更细致的分析。

meta states v2是“一个更具包容性的衡量公平性的数据集”，它来自七个国家录制的26467段视频独白，由来自巴西、印度、印度尼西亚、墨西哥、越南、菲律宾和美国的5567名付费参与者提供，他们还提供了包括年龄、性别和外貌在内的自我识别属性。尽管Casual Conversations最初发布的视频超过4.5万段，但它们是从居住在美国的3000多人中抽取的，并且通过更少的指标进行自我识别。

长期以来，人工智能产品一直受到种族主义、性别歧视和其他不准确反应的困扰，解决人工智能中的算法偏见是这个行业的一个重要障碍。这在很大程度上取决于如何创建、培养算法并将其提供给开发人员。

尽管meta认为《Casual Conversations v2》是向前迈出的重要一步，但专家们仍持谨慎乐观态度，并敦促继续对硅谷似乎轻率地进入人工智能驱动的生态系统进行审查。

西北大学(Northwestern University)计算机科学教授、该校机器智能安全促进中心主任克里斯蒂安·哈蒙德(Kristian Hammond)在一封电子邮件中写道:“在这个领域，几乎任何东西都是一种进步。”Hammond认为meta更新的数据集对公司来说是“坚实的一步”，尤其是考虑到过去的隐私争议，并认为其对用户同意和研究参与者的劳动补偿的强调尤为重要。

“但改善并不是完全的解决方案。只是一步，”他警告说。

对于哈蒙德来说，一个主要的问题仍然是，研究人员究竟是如何招募参与者来制作Casual Conversations v2的。他写道:“性别和种族多样性固然好，但你也必须考虑收入和社会地位的影响，以及种族更细致的方面。任何自我选择的人群都可能产生偏见。”

当被问及如何选择参与者时，meta公司人工智能通信团队的Nisha Deo通过电子邮件表示:“我可以告诉大家，我们聘请了符合我们要求的外部供应商来招募参与者，”补偿费率由这些供应商“考虑到该地区数据收集的市场价值”决定。

当被要求提供有关薪酬的具体数字时，meta表示“不可能在我们已经分享的基础上再扩大。”

然而，Deo补充说，meta故意在数据培养的每一步中纳入了“负责任的机制”，包括与香港科技大学的学术伙伴合作，对现有数据集方法进行全面的文献综述，以及注释者的全面指南。她继续说道:“负责任的人工智能在构建这个系统时考虑到了道德因素和公民权利，并将其作为一种资源开放，以提高人工智能的包容性。”

对于哈蒙德这样的行业观察人士来说，像Casual Conversations v2这样的改进是受欢迎的，但还需要做更多的工作，尤其是当世界上最大的科技公司似乎正在进入一场人工智能军备竞赛的时候。“每个人都应该明白，这不是完全的解决方案。这只是第一步，”他写道。“我们必须确保我们不会过于关注这一显而易见的步骤……我们停止刺探组织，以确保他们没有在未经同意的情况下收集数据。”

cript type="text/javascript">

• 长期供应各种型号岩棉复合板	• 对辊式破碎机粒径均匀中细碎各种石料
• 地矿/实验室用颚式破碎机原材料前段处理设备	• 诺发环保旋风除尘器设备
• 诺发环保活性炭吸附箱设备	• 河北诺发环保现货供应除尘布袋
• 诺发环保等离子净化器生产厂家	• 诺发环保除尘器生产厂家
• 上海诺发环保生产厂家除尘布袋	• 诺发环保生产除尘骨架

GSTBUC润滑油汽油机油	甲烷标气二氧化碳气
L30滚轮罐耳山东东达	北京信远XY系列消防稳