跳至主要内容
The Apache Software Foundation
Apache 20th Anniversary Logo

ASF 生成式工具指南

版本:1.0

ASF 项目的贡献可以包含 AI 生成的内容吗?

Apache-2.0 许可证和 Apache 个人贡献许可协议都提醒贡献者,他们有责任披露提交的贡献中任何并非其原创的版权材料。在使用生成式 AI 工具时,这一点与使用公共网站的材料或来自其他开源项目的代码一样适用。

在披露这些材料时,贡献者还应识别这些材料的许可证。ASF 维护了一个第三方许可政策,该政策提供有关哪些许可证可接受的指南,以及有关处理第三方作品的说明。

虽然一般来说,非人类(例如机器或猴子)生成的内容不可获得版权,但如果内容包含 AI 生成的一些部分和人类创作的其他部分,则人类创作的部分可能是可获得版权的。

如下所述美国版权局注册指南(2023 年 3 月 16 日)

“例如,人类可能会以足够有创意的方式选择或排列 AI 生成的材料,从而使“最终作品整体构成原创作品”。或者,艺术家可能会在很大程度上修改最初由 AI 技术生成的材料,以使修改符合版权保护的标准。在这些情况下,版权只会保护作品中人类创作的部分,这些部分‘独立于’并且‘不影响’AI 生成材料本身的版权状态。”

人类创作的这些部分可能仅仅来自人类提供的提示或他们随后进行的更改。但是,生成式 AI 的一个突出问题是存在复制其训练数据中可获得版权的部分的风险,其中一些可能是可获得版权的主题。因此,使用生成式 AI 工具时的推荐做法是使用具有识别任何包含内容(与工具训练数据的部分相似)以及该内容许可证的功能的工具。

鉴于以上情况,如果贡献者确保以下条件,则可以使用 AI 全部或部分生成的代码:

  1. 生成式 AI 工具的条款和条件不会对输出的使用施加任何与开源定义不一致的限制。
  2. 满足以下条件之一:
    1. 输出不是可获得版权的主题(即使由人类产生也不会是)。
    2. 输出中不包含任何第三方材料。
    3. 输出中包含的任何第三方材料都已获得第三方版权持有人的许可(例如,根据兼容的开源许可证)使用,并符合适用的许可证条款。
  3. 如果 AI 工具本身提供了有关可能与训练数据相似或来自代码扫描结果的输出的足够信息,则贡献者可以获得关于满足条件 2.2 或 2.3 的合理确定性。

在提供使用生成式 AI 工具创作的贡献时,建议贡献者说明用于创建贡献的工具。这应该作为令牌包含在源代码控制提交消息中,例如包含短语“Generated-by” 。这使得将来可以考虑使用提取此内容到机器可解析的 Tooling-Provenance 文件中的版本工具。

最后,请注意,虽然以上内容在 2023 年 6 月看来是一套合理的指南,但这是一个快速发展的领域。无论我们今天向 PMC 推荐什么,都必须根据以下情况重新评估和更新政策:

我们将继续与 PMC 和 ASF 成员沟通,因为本常见问题的更新将被讨论和合并。

文档方面呢?

上述文本也适用于文档。注意具有限制性许可证的生成内容的工具,应谨慎使用,确保其符合第三方许可政策第三方作品

图片方面呢?

与文档一样,上述原则仍然适用。尽管图片是非文本形式,但细节很快变得复杂。我们预计这将继续是一个快速发展的领域。

我们想使用的工具可能依赖于其他工具。在遵循本指南时,我们需要考虑哪些使用条款?

不要对供应商的使用条款 (TOU) 产生疑问。您对他们工具的使用受给定 TOU 的全部约束,并且您无需超出 TOU 文本以寻求进一步说明。

如果某个贡献包含 AI 生成的内容,并且某种形式的工具识别出了被复制的材料,我们该怎么办?

与任何其他贡献一样,请参考第三方许可政策

ASF 能否提供一个经过批准的生成式 AI 工具列表?

告知开发人员使用哪些工具不符合 ASF 的利益。您可以使用任何您想要的工具,前提是您遵循本文件中的指南。