Two snails facing each other on a piece of wood.

开源的迷失十年:人工智能的关键教训

开源从未真正解决移动和云计算的挑战。在人工智能领域…
首页 » 博客 » 开源的迷失十年:人工智能的关键教训

今天,开源的价值观在移动和云领域都显得格格不入。这是一个问题。我想提出开源社区如何为人工智能时代做好准备。

为了铺垫,让我们简要回顾一下2016年,当时意大利政府启动了数字化转型部门。它制定了一个三年计划,旨在使用开源软件构建国家公共数字基础设施。 

意大利政府以许多事情而闻名——色情明星政治家、权力更迭频繁、巨额公共债务——而且,是的,大多数都不是好事。相比之下,这项倡议是一项巨大的成就。他们建立了一个面向IT部门的门户网站,其中包含软件平台目录、API、发布工具、数据和指南。他们遵循了开源促进会、Linux基金会、开放基础设施基金会和其他组织多年来倡导的原则。这看起来无疑是一个值得效仿的榜样。

过了一会儿,当我仔细研究了数百万行开源代码和文档后,我失望地叹了口气。虽然它是开源的,但它与专有云功能存在内在联系,使其根本不那么“开放”。但我们不能责怪政府。在过去的十年中,开源并没有广泛解决移动和云计算的挑战。这意味着我们没有简单的方法来判断在这些上下文中开源意味着什么。

当我们站在人工智能和机器学习新时代的悬崖边时,我们不能再犯同样的错误。

开源的迷失十年

在当今的地缘政治环境中,这种对专有云功能的依赖是一个巨大的问题。欧盟一直在谈论战略主权,但依赖美国大型公司来运行关键基础设施(如意大利政府创建的基础设施)与这些目标相冲突。 

二十年前,当公共管理部门委托和部署仅在HP-UX或SCO Unix上运行的应用程序时,我声嘶力竭地倡导一种可行的替代方案:“在GNU/Linux上运行它!” 当时有一个庞大的社区在开发代码和交付解决方案;我们既是啦啦队,又是批评者。

今天,我们如何建议意大利政府?“不要使用那些无服务器功能,忽略按需计算和存储的便利性,放弃不必运行自己的数据中心的实际优势,而是投入精力学习如何以不同的方式做事。并且忽略这可能需要你数年时间才能学会如何去做,你会成功的……” 这听起来不太像数字化转型。

不要误解我的意思:这正是应该说的正确的事情。但是,我们是如何走到没有替代方案可供建议的地步的?我们为什么会无路可走?

这是开源运动忽视两种技术的引入的结果:云计算和移动技术。今天,开源的价值观在这些技术中大多显得格格不入。云计算和移动技术引入了在1980年代不可用的开发、分发和执行软件的新方法,当时GNU自由软件宣言的发布是为了保护自由。该定义不易适应现代计算。OSI是开源定义的捍卫者,自2000年代初以来一直在发展,但随着人工智能技术的快速发展和采用,开源标准必须由社区毫不拖延地建立。  

未来之路

在某些方面,我们回到了GNU软件仅在专有Unix工作站上运行的时候,我们不得不容忍专有软件与GNU和Linux共存。社区通过开发更多开源软件解决了这个问题,在所有硬件架构上逐个替换专有组件(Debian官方支持10种不同的架构,甚至更多,包括不受支持的架构。)在过去的几十年中,并且由于英特尔的“开放架构”,开源接管了DEC Alpha、Silicon Graphics、Sun、IBM、HP和其他公司的专有系统。

我们能否再次为移动和云开发开放的替代方案?这次努力的规模要大得多。除了开发可移植代码外,我们还需要开发新的“开放平台”来运行此类代码。这是一个艰巨的任务:想想你将如何取代iPhone/Android或AWS以及现代设备所依赖的数千种Web服务。 

鉴于这些环境中的大多数已经建立在开源之上,我们还需要创建新的框架来评估这些新平台的开放性。我们必须现实地看待在更加复杂的领域中保护真正的开源需要付出什么。  

抓住下一波浪潮:人工智能

几十年来,我们一直依赖版权和Copyleft,但这种方法在现代技术中显示出其局限性。人工智能和机器学习对开源定义的挑战甚至比云计算和移动技术更大。

人工智能和机器学习模糊了软件和数据的界限。人工智能系统引入了新的产物,版权法的适用性值得怀疑。生成式人工智能系统也对专利和商业秘密的许多既定理解提出了新的、复杂的法律挑战。构建功能性机器学习系统所需的大量数据也吸引了其他法律——从隐私保护到安全,再到非歧视和可访问性法律——一直到基本人权保护。许多现有的OSI批准的许可证在这些环境中无效。

尽管“开源人工智能”一词很流行,但尚无共同且一致的定义。尽管应用于机器学习模型的软件许可证很流行,但并非所有人都同意其条款的适用性。例如,Meta根据非常宽松的许可证(GPLv3)发布了其LLaMA模型的部分内容,但后来却向该模型修改版本的发行商发送了停止函,这与他们使用的许可证条款相矛盾。

为了将开源原则带入未来的技术,我们必须认真、仔细、快速地思考如何将“开放”的指导原则应用于人工智能/机器学习领域。OSI正在呼吁利益相关者加入全球起草进程,为应用于人工智能/机器学习的“开源”定义。

参与进来

以下是如何提供帮助的方法

  • 成为OSI的个人会员:这将显示社区的广泛兴趣,而不仅仅是大型企业捐助者。共有三个级别:支持和专业,如果您可以负担得起捐款,或者如果每月4美元太贵,您可以免费加入。
  • 捐款给OSI:捐款帮助我们提高对企业捐助者的独立性。
  • 关注人工智能起草过程:OSI将在未来几个月内在线下举行会议,发布新版本的定义草案。留下评论并广而告之。
  • 注册参加深度研讨会系列:听取专家关于人工智能世界中“开源”的看法。

通过与开源社区互动,加入我们的下一个篇章。发出你的声音,帮助我们避免开源的迷失十年重演。

照片由Alexas_FotosUnsplash上拍摄

作者

  • Stefano Maffulli

    Stefano Maffulli是开源促进会(OSI)的执行董事。作为一名热情的开源用户,他贡献了文档补丁、翻译,并倡导了GNU、QGIS、OpenStreetMap和WordPress等各种项目。

    查看所有文章

如果您喜欢这篇文章,您可能也会喜欢这些