图片素材库Shutterstock靠签订「资料授权」在2023年进帐超过1亿美元!为何Meta、OpenAI等大厂纷纷上门?训练AI跟素材库有何关联?
AI公司授权费,已占年营收约11%
在AI创造可行的商业模式前,提供「燃料」的各个线上内容平台,已经靠着AI开辟新商机。
知名图片及音乐素材平台Shutterstock,就找到了新的成长机会,它们藉由授权AI公司使用素材库内容,用以训练AI模型,让Shutterstock一年可进帐上亿美元!
各家科技公司竞争开发最优秀的AI模型,这让各个媒体、内容平台获得了新的营收可能性。
Shutterstock执行长保罗. J.轩尼诗(Paul J. Hennessy)透露,2023年他们靠着授权AI公司使用他们的素材,获得1.04亿美元的收入。
根据Shutterstock今年2月公布的2023年财报,去年营收约为8.75亿美元,换句话说,现在提供AI公司授权的收入,已经贡献约11%的年营收。
Reka AI是Shutterstock在AI领域最新一位授权合作伙伴。图/ Reka AI
先前Shutterstock就已经透露,他们以一年约1,000万美元的价格,和多家科技公司缔结了授权协议。事实上,ChatGPT登场后不久,Meta、Google、亚马逊及苹果等公司都相继和Shutterstock达成协议,而OpenAI更是一口气签订长达6年的授权协议。
现在与Shutterstock缔结协议的公司还在增加当中,本周才宣布与Reka AI进行授权合作。该新创成立于2022年,也是一间投身大型语言模型开发的AI公司,声称其多模态模型Reka Core在部份排名或指标上有着超越Claude、Gemini等主流模型的表现。
Reka执行长Dani Yogatama在声明中指出,Shutterstock拥有来源全面的合法授权内容,以及顶尖水准、人工建立的后设资料(metadata),「与Shutterstock的合作对我们来说非常关键。」
至于Shutterstock的资料量有多少,他们曾在今年2月透露拥有7.71亿张照片、5,400万部影片、400万条音轨、100个3D模型。
近年来该公司收购了GIF网站Giphy、影音素材库Pond5,这些都壮大了他们所拥有的资料阵容。
先签授权,避免著作权争议找上门
不光只是Shutterstock,社群平台Reddit也声称,已经签订总价值高达2.03亿美元的资料授权许可,提供平台上1亿则发文和16亿则评论供AI公司训练模型。
Google就曾与Reddit敲定6,000万美元的合约,而OpenAI也在今年5月宣布与Reddit达成合作协议。
科技公司开始积极与媒体缔结授权,一部分或许也是因为各家媒体对内容是否被擅自拿来训练AI越来越敏感,去年12月《纽约时报》便把OpenAI及微软一状告上法院,指控这两家公司侵犯其著作权。
OpenAI近来也积极与各家媒体缔结合作,确保合法合规的训练资料来源。图/ Zac Wolff on Unsplash
现在OpenAI也积极与新闻媒体签订授权合约,包括《华尔街日报》母公司新闻集团、Vox、《大西洋》、《世界报》母公司Axel Springer、Prisa等众多媒体公司达成合作协议,不过并未对外公布各个合作的实际金额。
授权费收入看涨,带动素材平台成长
Shutterstock与Reka AI这次合作同样没有对外披露金额,不过预计负责授权的业务部门今年营收将达到1.38亿美元,与去年的1.37亿美元大致相同。
虽然看似增长不多,但《彭博社》指出,2022年时该业务营收仅3,900万美元,再前一年则只有1,600万美元,足以显示AI掀起热潮后的差异。
轩尼诗也强调只是合约结构的差异,使得今年授权营收持平,并不缺乏缔约的AI公司,看好2027年该业务营收可达到2.5亿美元的表现。