去年,OpenAI 在旧金山举办了一场高调的新闻发布会,在那次活动中,该公司宣布推出了一系列新产品和工具,包括备受争议的类似应用商店的 GPT Store。
然而,今年将是一个更加低调的活动。周一,OpenAI 表示,将把其 DevDay 大会的格式从支柱活动改为一系列面向开发者的路演会议。该公司还确认,将不会在 DevDay 上发布其下一个重要旗舰机型,而是专注于更新其 API 和开发者服务。
OpenAI 的 DevDay 活动将于今年的 10 月 1 日在旧金山、10 月 30 日在伦敦和 11 月 1 日在新加坡举行。所有活动都将包括讲习班、分组会议、与 OpenAI 产品和工程人员的演示以及开发者亮点。注册费用为 450 美元,申请将于 8 月 15 日截止。
近几个月来,OpenAI 在生成式人工智能领域采取了更多渐进式步骤,而非突破性的飞跃,选择在训练其现有领先机型 GPT-4o 和 GPT-4o mini 的继任者时,精雕细琢其工具。该公司已经开发出改进模型整体性能的技术,并防止模型频繁出现问题,但根据一些基准测试,OpenAI 在生成式人工智能竞赛中失去了技术领先地位。
原因之一可能是寻找高质量训练数据的挑战日益增加。
像大多数生成式人工智能模型一样,OpenAI 的模型是基于海量网络数据进行训练的。许多创作者选择对数据进行监控,以防止其被抄袭,或者担心他们将无法获得认可或补偿。根据 Originality.AI 的数据,全球前 1000 个网站中有超过 35% 禁止 OpenAI 的网络爬虫。麻省理工学院的数据来源调查计划的一项研究发现,约 25% 的“高质量”数据源的数据已被限制,无法用于训练人工智能模型的主要数据集。
如果目前的访问阻止趋势持续下去,研究组织 Epoch AI 预测,开发者将在 2026 年至 2032 年之间用尽训练生成式人工智能模型的数据。这一趋势以及对版权诉讼的恐惧迫使 OpenAI 与出版商和各种数据经纪公司签订高昂的许可协议。
据说 OpenAI 已经开发出一种推理技术,可以改进其模型对某些问题的回应,尤其是数学问题,该公司的首席技术官 Mira Murati 承诺,未来的 OpenAI 模型将具有“博士级”智能。这是对很多挑战的承诺,也面临着高标准的压力。据称,OpenAI 追加数十亿美元用于训练其模型和聘用高薪研究人员。
时间将会证明 OpenAI 能否在处理困扰自己的许多争议的同时交付成果。