谷歌在谷歌翻译中首次推出了解决偏见的人工智能
新时代,高科技越来越发达。朋友们读了很多关于科技的重要新闻。我们也应该在生活中使用很多这些高科技的东西。朋友应该注意什么?今天,我想和大家分享一条关于科技的知识。我希望你会喜欢它。
谷歌今天宣布,它将在谷歌翻译中发布从英语到西班牙语和芬兰语、匈牙利语和波斯语到英语的性别翻译。这些翻译采用新的范式,通过重写或后编辑最初的译文来解决性别偏见。这家科技巨头声称,这种方法比支持谷歌翻译(Google Translate)按性别区分的土耳其语到英语翻译的早期技术更具可扩展性,主要是因为它不依赖数据密集型的性别中立检测器。
谷歌研究院高级软件工程师梅尔文约翰逊(Melvin Johnson)写道:“自最初发布以来,我们取得了巨大的进步,不仅按性别提高了翻译质量,还将其扩展到了其他四种语言对。”“我们致力于进一步解决谷歌翻译中的性别偏见,并计划将这项工作扩展到文档级翻译。”
正如Johnson解释的那样,用于从土耳其语到英语的性别特定翻译的旧分类器一直在努力适应新语言,但未能通过使用神经机器翻译(NMT)系统独立生成男性和女性翻译。此外,它不能显示多达40%的合格查询的性别特定翻译,因为这两个翻译通常不完全相同,除了与性别相关的现象。
相比之下,新的基于重写的方法首先生成翻译,然后对它们进行审查,以确定性别中立的源短语生成性别特定翻译的情况。如果是这种情况,句子层面的改写者会选择另一种性别的翻译,然后对第一个和改写后的翻译进行审核,确保唯一的区别是性别。
根据谷歌的说法,构建一个重写器需要生成数百万个由成对短语组成的训练示例,每个短语包含男性和女性的翻译。由于数据不易获取,Google Translate团队不得不从一个庞大的单语数据集入手,通过将男性代词从男性转换为女性(或者反过来)来提出候选改写。对于这个重写后的语料库,工程师采用了内部语言模型,该模型训练了数百万个英语句子来选择最佳候选,从而将训练数据从男性输入转换为女性输出,反之亦然。
本文就为大家讲解到这里了。