首页 > 资讯 > 评论

阿里云新起点:大模型不必大门槛

2023/04/14 09:25      新立场   


  “一家企业想象力终归有限,释放AI潜力要靠无数人探索”

  4月11日,2023阿里云峰会在北京国家会议中心召开。相较于之前几届峰会,这次的活动因为两个原因而格外引人关注。

  首先,这算是在去年底的那次组织调整后,张勇第一次以阿里云智能总裁身份在如此量级的活动上亮相,外界当然希望了解他对云计算模式的系统思考和业务上可能采取的重大调整。

  其次,从OpenAI发布ChatGPT以来,业界和公众都认识到了这类大模型的巨大潜力,并以一种军备竞赛的方式开启了从基础设施、工程能力到AI算法的全面比拼。虽然在峰会之前,阿里已然官宣了自研大模型“通义千问”的问世,但关于这个模型将如何嵌入集团业务生态或者将在多大程度上对外开放之类的问题,仍然留待进一步的解答。

  不过事后来看,观众的等待和好奇都颇为值得。根据峰会透露的信息,未来阿里巴巴所有的产品都要接入大模型进行全面升级。其中,钉钉和天猫精灵目前已经在测试接入“通义千问”,前者可以实现自动撰写工作方案、根据UI草图直接生成应用等功能,后者则显著提升了智能化水平,最终有望从机器进化到情感陪伴对象。

  而除了将“通义千问”跟集团内部业务打通,阿里还抛出了建设全新AI生态的宏伟目标。在通常关于类ChatGPT大模型的讨论中,都免不了提到开展这些项目所需的巨大的资源门槛。根据对业内人士的采访,这不仅是将中小企业排除在外,甚至一些规模较大的互联网公司都难以负担。

  阿里显然看到了这个痛点,并提出了解决方案。张勇和周靖人的发言都提到,阿里希望众多的企业和开发者都能用到阿里提供的大模型基座,每家公司都能结合他们的行业知识和经验,来形成自身的专属模型。

  客观的讲,这其实是阿里云以往生态开放思路的延续,因为早在ChatGPT出圈之前,阿里就已经提出了模型即服务(MaaS)的概念。像去年上线的国内首个AI开源社区——“魔搭”,不到半年就有了上百万用户,发展速度远超预期。

  根据埃弗雷特·罗杰斯的理论,任何创新的扩散都遵循从创新者到早期采用者,再到早期跟进者等的诸个阶段。就大模型这项AI领域堪比“iPhone时刻”的重大创新而言,阿里显然希望通过技术普惠的方式降低它的门槛。当这项技术能够通过尽可能多的企业触达尽可能多的用户时,也就能发挥出它最大的社会价值。当然随着更多的用户参与进来,生态活力也会得到反哺,形成正反馈的多赢链条,这大概也体现了阿里和张勇本人的商业哲学。

  01、云计算铺路,大模型提速

  在“通义千问”出现过后,大概有群众会觉得阿里是“平时不烧香,临时抱佛脚”,不然怎么会ChatGPT出来之前没有,ChatGPT出来过后就马上亮相了。然而正如阿里云CTO周靖人在接受媒体采访时所说的,ChatGPT的确非常领先,当下的OpenAI某种程度上正在给整个行业设置议程,但阿里并不是今天有了ChatGPT过后,才凑热闹加入到做大模型的行列。恰恰相反,阿里是国内最早探索大模型方向的公司之一。

  这从“通义千问”这个名字就能看出来。媒体曾在采访周靖人时问到,为什么要叫这么一个文邹邹的名字?周回答到,这其实是因为阿里在去年9月份的时候就发布了“通义”大模型系列,也就是说这条发展路线在ChatGPT问世之前就已经确定。所以通义是一个模型系列的名字,千问则是指它目前主要是对话形态。“千万次的追问是人类获取智慧的方式,我们希望千问也能够不断地学习逼近人类的智慧”,周靖人说。

  从时间上讲,阿里云从2019年就开始训练大模型,曾陆续发布语言大模型Plug、万亿参数的多模态大模型M6,这些都是去年“通义”大模型系列整合的基础,也是阿里能快速推出 “通义千问” 并提供相应服务的前提。

  其实阿里云做大模型,既带有科研前瞻的性质,也有比较强的业务逻辑。从2009年阿里云第一次在国内实践云计算这个概念以来,过去十几年时间里云计算厂商极大地促进了国内各行各业的数字化转型。

  云的渗透速度非常可观,这从阿里云的客户结构就能看出来:最初是泛互联网行业为主,如今互联网之外的客户占比已经达到六成,并且还在以远超前者的速度快速增长。在经过这样一个数字化铺垫的过程后,大模型的出现可以说是恰逢其时,因为它能很好地利用这个基础,并改善数字化转型的速度和质量。

  同时,大模型也将给云计算行业带来巨大的机会,这主要包括模型的训练和模型的服务两个方面。

  从模型训练的角度讲,类ChatGPT之类的大模型对计算资源提出了新的要求。例如,微软最开始给OpenAI投资的10亿美元,大多数都被OpenAI花在了购买Azure的计算服务上面。阿里云也有一套类似的“飞天智算基础设施”,可以满足大模型训练的各种需求。

  其中,智算IaaS服务包括可支持最大十万卡GPU单集群规模、可承载多个万亿参数大模型同时在线训练的智算集群,可为万卡规模AI集群提供无拥塞通讯的自研RDMA网络架构等;AI训练效率提升可达10倍,推理效率提升可达6倍,覆盖全链路AI开发工具与大数据服务。

  而从模型服务的角度讲,云部署的方式相比企业自定义方案,显然能在算力、网络等方面提供更好的支撑。这本质上跟前期众多企业选择把软件从自有机房迁到云上是一样的道理。本次峰会上,阿里还宣布了有史以来最大幅度的一次降价,通用计算对比上一代主售产品最高可下降40%。

  另外,根据张勇的介绍,跟十年前相比,阿里云提供的算力服务价格降低了 80%,存储服务的价格降低了接近 90%。预计在技术创新和规模效应的加持下,阿里云未来还将提供更好的计算服务能力。

  02、模型不必大门槛

  如张勇所说,面向AI时代,所有产品都值得用大模型重新升级。这主要涉及两个方面,一是阿里自己会怎么用大模型,怎么用大模型全面改造用户产品和业务产品来释放智能生产力;二是怎么让各行各业的外部客户也用上大模型,会提供哪些工具和设施来加速大模型的扩散和采纳。

  在过去的二十年里,阿里旗下已经积累了丰富的产品矩阵,覆盖电商、出行、娱乐、社交、生活、办公等各个领域。因此相较于OpenAI这类纯人工智能科技公司,阿里其实有着更短的模型到应用转化路径,并且能够更加深刻地介入这个转化过程。

  上述优势已经在这次峰会的发布内容里体现出来。新一代钉钉在跟“通义千问”大模型能力结合后,又往智能办公的方向迈进了一大步,这说明阿里内部大模型的研发跟应用是同步进行的,显著区别于微软在OpenAI的ChatGPT面世后才考虑将其整合进必应的动作。限于篇幅,我们在这里简单拉了一下钉钉“上新”的内容:

  当新成员进入群聊时,钉钉会根据群内已有的聊天内容,自动生成聊天摘要。用户不需要再手动爬楼翻阅历史,就能快速理解任务的上下文。同时,当聊天涉及共识对齐之类的动作时,还可以自动生成代办事项。

  针对日常办公的文本写作,钉钉已经可以根据需求自动生成活动策划、会议策划等工作流程方案。除了文本内容以外,钉钉也支持从文字生成创意图片。

  对于办公会议,钉钉可以实时生成字幕,并且自动识别并标注发言对象,会后也能自动生成会议纪要和待办。

  对于办公应用的开发,钉钉已经从之前的低代码模式,进一步升级到根据功能UI草图,就能自动产出代码。

  除了钉钉,天猫精灵在接入“通义千问”后能够支持自有对话,还能根据用户需求和场景随时生成内容。例如,用户可以在跑步时给出类似“合成1小时歌单,50%穿插摇滚风格的歌曲”这类的指令,还可以跟天猫精灵天马行空聊文化谈人生。当然,无论钉钉还是天猫精灵当前的表现,都只是大模型能力的一角,未来在经过更多打磨催化更多产品后,“通义千问”应该会有更全面的表现。

  但跟自身业务结合只是阿里建设大模型生态的第一步。阿里的商业模式一直以来,都是建立在“帮别人更容易做生意”这个底座上,“通义千问”延续了这个传统。周靖人在会上说,阿里将开放“通义千问”的能力,并提供完备的算力和大模型基础设施,让每一家企业能够打造自己的专属GPT,让包括创业公司在内的所有企业和机构更好地实现创新。

  简言之,阿里不希望大模型成为少数几家公司的专属玩具,而是希望大模型没有大门槛。

  在采访环节,周靖人解释了阿里此举背后的想法:“通义千问是通用大模型,要应用到实际场景时,每个企业都有自身需求,但不是每个企业都要从头开始去做大模型。我们希望能以通义千问为基础,结合各企业相关体系,为企业打造专门的数据空间。”

  未来企业只需要把专有数据放到阿里云开辟的专属数据空间里,不需要做数据清理和标注,也不需要从头开始训练,企业就能获得自己的专属大模型。在预训练基础上做微调的方式也有多种选择,客户可以自己微调(fine-tune),也可以做有监督的微调(SFT)训练,还可以直接在提示、指令层(prompt)上做调整。

  峰会现场,阿里云宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施。同时吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业也表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。

  除了专门的企业客户,阿里云也在为更广大的开发者和社区组织搭建服务生态。阿里是国内首次推出模型即服务(MaaS)的企业,因为从开发者的角度,其会更多地以模型为第一思考的角度和元素,今天围绕模型做开发的范式正逐渐诞生。

  为了帮助模型生态的快速发展,阿里云提出了MaaS,而为了加速MaaS,阿里云又搭建了“魔搭”这样的社区。用CTO周靖人的说法,“这些工作都是相互强关联的,是在我们整个AI战略和模型战略的主线上。”

  “魔搭”(ModelScope)社区是阿里云去年11月上线的,聚集了多个机构开发的人工智能大小模型,开放给更多人使用。阿里方面表示社区发展远超预期,短短几个月,已经有上百万人下载了1600万次各类模型,模型数量从最初的300多个扩展到800多个,其中十亿参数以上的大模型有30多个,超百亿参数的大模型有10个。

  03、写在最后

  从此前的高管采访和本届峰会的发布内容看,“通义千问”是阿里大模型研发过程的一个中间态。

  它不是起点,因为在这之前阿里已经有了一张大模型和围绕大模型生态的蓝图,并坚定持续地往里面砸了大量资源,这次不过是把过去积累的部分工作向外界开放了而已。

  它更不是终点,因为从钉钉和天猫精灵这些内部产品初步应用大模型后的效果看,在云计算基础设施和魔搭的社区生态等因素的支撑下,大模型的正向效应必将很快溢满阿里整个产品矩阵,并从阿里走向社会。

  张勇在接受采访时说,“这次的大模型出现,是个划时代的里程碑,看整个的工业革命的历史,其实从蒸汽机时代,工业革命的开始到现在,我觉得人类可以进入到一个全新的智能化时代。”

  智能化时代已经开启,广阔天地,大模型大有可为。

  榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。

相关阅读

    无相关信息