主管QQ:站内信联系

京东云何晓冬:京东言犀大模型将以三步走路径服务产业2023-07-25 01:21

  7月13日, 2023京东全球科技探索者大会暨京东云峰会上,京东推出面向产业的京东言犀大模型和言犀AI开发计算平台,发布支撑大模型落地行业的产品及解决方案,致力于服务千行百业跨越产业新智能。

  京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬表示,选择开发面向产业的大模型是正确且具有挑战的事情,京东言犀大模型将以三步走路径先进行内部实践再服务产业。

  以Transformer为代表的基础技术迈过了“智能涌现”门槛以后,广泛的技术与产品应用像雨后春笋一样般涌现出来。但大模型的难点不在技术追赶,而是产业突破。大模型落地产业,面临着知识深度、内容准度、模型速度、安全可控度等多重挑战,道阻且长。

  京东选择了与行业内通用大模型的差异化路径,推出面向产业的大模型并非随波逐流,而是背靠产业实践中生长出的技术实力与场景优势。大规模的效率需求与京东内部场景的反复验证与实践,使言犀大模型具备丰厚的产业数据及前沿独创的算法。

  京东具备大模型发展的数据沃土,其产业数据禀赋炼就了最适配产业场景的大模型。除了通用性数据,京东将零售、金融、健康、物流等广泛专业领域数据也放到基座模型进行训练,融合70%的通用数据与30%数智供应链原生数据。这种长链路、复杂协同、更多动态数据回流的京东场景,是大模型的最好练兵场。每年数百亿智能交互数据,更保证了言犀大模型模型本身知识的丰富度,“某种意义上,我们相当于既做了通识教育,又读了四年专业性的本科教育。”

  前沿独创算法架构是大模型的支撑。大模型的研发并非一蹴而就,靠的是细水长流。回归大模型底层技术,Transformer是这一轮人工智能技术取得实质性突破线年起,京东就开始关注到运用深度学习模型、注意力机制,来理解意图、生成语言,使得文本生成更加高可靠,忠实可信。

  言犀在业内首创提出了基于领域知识注入的模型K-PLUG,采用推理低延时策略,推理速度提升6.2倍;可以低成本完成模型部署,成本降低90%;并打造了基于自动化机器学习的数据模型迭代策略。

  现阶段,基于京东集团核心产业数据,京东推出了言犀大模型与大模型计算开放平台;今年内,应用于京东域内多项核心业务,通过模型精调提升专业域任务能力;在明年上半年,将面向京东域外重点产业场景全面开放大模型能力,向产业输出可用可控可信可负担的定制化模型。这背后是言犀大模型对于算力、场景、产品的扎实实践。

  新型算力是实现智能涌现的活水之源。京东拥有全国首个基于DGX SuperPOD架构的超大规模计算集群——天琴α,每秒浮点运算数提升40%,多卡线年开始自主研发向量数据库Vearch,平稳支撑京东百亿级向量数据高性能检索,延迟时长降低到毫秒级,降低60%存储成本降低和80%推理成本。

  言犀大模型建立了强大的工程化能力,技术与应用、数据和算法的迭代飞轮。大模型是数据、算法、算力等要素资源之间的精巧组合,京东的AI是基础技术和产品落地是紧密结合的,京东除了投入大规模、高质量的语料作为“养料”,还通过不断地对其进行工程化调优,使得言犀大模型可以真正开始高效提炼、蒸馏人类的知识,达到类似于人的高度智能。

  针对模型的快速应用也做到了极致。言犀AI开发计算平台沉淀了京东在零售、物流、健康、金融等行业多年积累的知识,通过算法工具集成到平台,并部署了100多种训练和推理优化工具,结合低代码应用平台,为客户提供从数据建设到模型应用的一站式服务。之前需要10余人的科学家团队工作,现在只需要1-2个算法人员;通过平台模型加速工具优化,节约90%的推理成本。

  GPT所表现出的超越以往的通用性,让大众看到实现通用人工智能(AGI)伟大目标的可能性。多模态和具身智能是大模型演进,走向落地产业的必然路径。

  京东场景天然是多模态的“练兵场”,拥有大量图、文、音视频等富媒体数据积淀优势,京东云已持续投入多模态技术研发7年,在多模态数字人领域,言犀大模型将单人数据进行参数差异化迁移,支持5分钟高效视觉形象建模,支持生成大姿态如侧脸、走动、手势等,支持语义驱动的肢体动作生成,实现动态高分辨率调整的视觉体验。在电商直播场景中,言犀虚拟主播已经上线+家品牌直播间,累计带动8亿元GMV。

  大模型终将走进物理实体世界。大模型正在重构包括工业制造、机械臂、自动驾驶车等应用场景,在现实物理世界生成一个大的训练、培养环境,实现了机械智能,给物理实体世界带来更多自动化和潜在价值。

  未来,京东云将以用不同模态的能力服务千行百业,让AI从数字世界走进实体世界,与伙伴和企业共同全面步入产业智能时代。