No menu items!

    YouTube被爆用用户上传的影片 训练Google AI模型

    CNBC报导,Google正运用庞大的YouTube影音数据库,训练其人工智能(AI)模型。(路透)

    CNBC报导,Google正运用庞大的YouTube影音数据库,训练其人工智能(AI)模型,包括Gemini、及影音和音频生成工具Veo 3,而且许多创作者并不知情。

    知情人士透露,Google正运用超过200亿支YouTube影片,训练这些新时代的AI工具。专家指出,这可能造成和创作者与媒体业者之间的知识产权争议。

    Google证实仰赖YouTube训练其AI模型,但表示训练只会用到特定子集的影音,遵循和创作者及媒体公司的特定协议,「我们总是用YouTube内容精进我们的产品,这点在AI出现后并未改变」,「我们也认知有必要设施护栏,因此我们投资强大的保护措施,允许创作者在AI时代保护其影像和作品,这是我们承诺会继续做的事情」。

    YouTub去年9月已宣布,将以YouTube内容「改善产品体验…包括通过机器学习与AI应用」,但专家指出,创作者和媒体机构并未广泛理解,Google正运用影音训练训练AI模型,YouTube也未说明在该平台的200亿支影音中,有多少、以及那些被用来训练AI。基于该平台的规模,只用1%训练,就相当于23亿分钟的内容,训练数据比其他竞品AI模型多出40倍。

    此外,上传内容到YouTube平台的用户,虽能选择不让自己的内容被亚马逊、苹果及辉达(Nvidia)等特定AI公司用于第三方训练,却没办法选择不让Google用来训练其AI模型。

    CNBC指出,在询问多位创作者和知识产权专家后,没人知道、或曾被YouTube通知其内容可能被用于训练Google的AI模型。在Google 5月宣布Veo 3模型后,YouTube会以用户影音进行训练值得关注。Google在发表Veo 3模型时,展现院线片水准的影像串行,整支影片的视觉与音频全是由AI生成。

    为创作者保护数字身分的Loti公司首席执行官艾瑞冈尼指出,在创作者耗费大量心力制作影音后,Google很可能再从这些影音取得数据,帮助Veo 3模型成为这些创作者的「临摹」与「合成」版。

    根据YouTube,几乎所有主要媒体业的得利创作者每天平均会上传2,000万支影音到该平台,许多创作者表示,现在担心自己可能在不知情的情况下,帮助训练一个最终可以成为竞争对手、甚至可能取代自己的系统。

    即便Veo 3的最终成品未直接拷贝现有作品,这些生成的内容仍可能促成一些商业工具,未来和创作者相竞争,而且都未取得原始创作者同意、未提供补偿、也未标明来源。

    帮助个人作品授权、并保护作品免遭滥用的Vermillio公司首席执行官尼利说,愈来愈多创作者发现各平台都出现自己作品的伪造版,Veo 3这类新工具只会加速这个趋势,虽然YouTube有权使用其平台的内容,但许多创作者都不知道自己的影音正被用于训练会生成影音的AI软件。

    Vermillio运用自有工具「Trace ID」,评估一支AI生成的影音内容是否与人类创作的影音大幅重叠,以零到100评分,例如一支来自澳洲创作者布罗迪罗斯(Brodie Moss)的影音,与Veo 3生成的内容高度符合,影音辨识分数为71分,光是音频就超过90分。

    热点

    发表评论