北京日报客户端 | 记者 袁璐
(资料图片仅供参考)
大模型“混战”下,互联网巨头、科技公司纷纷秀出“肌肉”,腾讯云则选择直接瞄准产业场景,参与大模型在行业端的应用。6月19日,腾讯云在行业大模型技术峰会上首次公布MaaS(模型即服务)解决方案,宣布将推出行业精选模型商店。
不过,专家认为,目前通用大模型落地行业场景,仍面临算力成本高、服务价格贵的挑战,想要走向好用、用得起的阶段,仍需降低成本、提高算力效率。
行业大模型有了“APP store”
“虽然大家对通用大模型期待很高,但它不一定是满足行业场景需求的最优解。”腾讯集团高级执行副总裁汤道生在会上表示,通用大模型一般都是基于广泛的公开文献与网络信息来训练的,网上的信息可能有错误、有谣言、有偏见,许多专业知识与行业数据积累不足,导致模型的行业针对性与精准度不够,数据“噪音”过大。但是,在很多产业场景中,用户对企业提供的专业服务要求高,容错性低。
汤道生认为,企业更需要有针对性的行业大模型,能在实际场景中真正解决某个问题。他进一步表示,训练数据越多,模型越大,训练与推理的成本也越高。“如何在合理成本下,选择合适的模型,是需要思考与决策的。”
因此,腾讯云决定推出了MaaS服务。具体来看,该服务会为客户提供模型预训练、模型精调、智能应用开发等行业大模型解决方案,其次,企业可以根据腾讯云TI平台内置的大模型,加入企业自己的数据,生成专属模型。企业也可以根据自己的业务规模,选择不同参数、不同规格的模型服务。
会上,汤道生宣布打造行业精选模型商店,目前已经覆盖金融、文旅、政务、传媒、教育等10大行业,提供超过50个解决方案。
产业场景成大模型“练兵场”
在现场,腾讯云副总裁吴运声用一个“文旅大模型”作为商业落地案例。“节假日有哪些比较经济的旅游景点推荐?”如果一个用户这样问,基于通用大模型的客服机器人,可能会给出一些简单的景点介绍和路线规划。但是,当大模型用大量有针对性的行业数据来做模型精调之后,客服机器人的回答就变得更加细致,给出经济实惠的定制化推荐方案。
“产业场景是大模型最佳练兵场。”汤道生表示,模型最终要在真实场景落地,在模型研发过程中,既要关注敏感数据的保护与安全合规,也需要管理好大量的数据与标签,不断测试与迭代模型。
记者注意到,早在2019年,腾讯云就宣布已打造了超过200个产品和90个行业的解决方案,覆盖了零售、金融、政务、医疗、文旅、教育等领域。
如今,腾讯云基于大模型的解决方案和此前的行业解决方案有何区别?对此,吴运声在采访时对记者回应称,以前一些在技术上不好解决或解决成本很高的问题,用了大模型的技术后可能有更好、更容易的一些解决手段。
走向千行百业仍需降低成本
“未来的大模型服务很可能将会是订阅式的付费模式。”业内人士表示,大模型尤其是私有化的大模型价格和硬件投入较高,短期来说,对企业来说是相当大的一笔支出,但从长期来看,企业运营和创新的整体成本可能会因大模型的效率提升而降低。“为平衡预算压力,企业很可能会向大模型服务提供商按需定制大模型能力,按需支付相应的服务费。”
近段时间,大模型赛道进入“百模大战”,云端竞争加剧。6月1日,阿里云推出AI产品“通义听悟”,成为国内首个开放公测的大模型应用产品。6月9日,科大讯飞升级“讯飞星火认知大模型”,宣布开放式问答取得突破等。
不过,目前通用大模型落地行业场景,仍面临算力成本高、服务价格高昂的挑战。英伟达的研究表明,GPT3最大规模的模型需要使用175 Billions的参数量,需要使用512颗V100显卡训练7个月时间,或者使用1024颗A100芯片训练一个月时间,大模型训练每月成本在数百万美元以上量级。据业内人士透露,由于训练成本高、数据筛选难度大,千亿参数模型的报价往往高达数十万元。
“一旦大模型聚焦在垂直行业领域发展,走向千行百业应用,会趋使模型变小。”某专注人工智能加速器资源池化的科创企业创始人对记者表示,垂直行业小模型和专业领域数据集可以缩小企业的训练范围与强度,降低整体训练成本。“一个产业的发展,一般会有可用、好用和用得起三个阶段,当前大模型正处于可用阶段,未来想要走向好用、用得起,降低成本、提高算力的效率将是必然之选。”