百度成AI独角兽的壮大土壤
AI大模型时代,百度要做的就是苹果/Google在移动时代做的事情:提供基础设施,让AI大模型开发者有壮大的土壤,让千行百业的企业可以用好AI技术这一生产力工具。美国开发者正基于ChatGPT或其他语言模型开发新应用。在中国,更多开发者将会基于文心大模型来开发AI应用。
科技巨头都在狂卷大模型,拼参数,拼性能,拼算法。理论上来说,它们都可以给开发者提供大模型基础设施。不过罗超频道认为,构建大模型生态系统这件事,在中国恐怕只有百度有机会做好。
首先,百度有“独门绝技”。文心一言是公认的中国最先进的AI大模型,在中文AIGC上具有显著优势,这是百度十多年来投资千亿布局AI的厚积薄发。文心一言不是从0到1,百度多年来一直在布局深度学习、知识图谱、NLP技术,早在2019年就已推出ERNIE文心大模型。大规模、长周期、持之以恒的投入,让百度文心一言的核心指标稳居世界第一梯队。正因为此,百度才有底气率先发布面向公众的文心一言,同时在第一时间将大模型能力通过智能云开放邀测。
(文心大模型全景图)
其次,百度有“落地能力”。在大模型概念出现前,百度就立志要做AI产业化和产业AI化的推手,这些年一直在不断推动飞桨PaddlePaddle深度学习平台的落地,建立了国内最大的AI开发者社区,截至2022年末,百度飞桨已凝聚535万开发者,服务20万家企事业单位,创建67万个模型,百度基于飞桨培养了超过300万AI人才。IDC 发布《中国深度学习框架和平台市场份额,2022H2》报告显示,百度稳居中国深度学习平台市场综合份额第一。
(飞桨PaddlePaddle深度学习平台官网)
基于飞桨深度学习平台,百度在2019年就推出ERNIE文心大模型,2021年正式发布全球首个知识增强千亿大模型鹏城-百度·文心,参数规模2600亿。2022年5月百度在业内首发了多个行业大模型,基于通用数据训练和知识增强的文心大模型,深度结合交通、制造、金融、能源等行业的数据和知识,进行行业创新算法设计,推出行业大模型以适合在对应行业进行AI产业级应用。2022年底,百度就提出了“行业大模型产品化”的概念,“将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务,从而形成一条大模型产业化路径。”
(2022年11月,罗超频道对文心大模型的“产品化”理念进行了解读)
现在看来百度上述推动大模型落地的举措都十分具有前瞻性,不同的是前两年百度需要“教育”开发者大模型是什么并推动他们去应用,如今开发者被ChatGPT、文心一言等产品教育后,主动蜂拥而至。前段时间,有媒体消息已有15万企业申请文心一言内测,其中有超300家生态伙伴在400多个具体场景取得测试成效。
一切都是水到渠成的结果。这些年来百度一直在推动AI落地到产业,基于百度智能云、百度飞桨、百度文心大模型来帮助开发者们构建原生AI应用。文心一言是百度一直在做的事情的延续。
因为十分重视“落地”,百度文心一言也早已将“成本”当成核心指标去优化。在发布2023年Q1财报时李彦宏透露,3月以来,对文心一言进行了四次升级,在某些场景下,可以把文心一言的成本降低90%。大模型现在普及的“卡点”就是成本高,百度对大模型成本优化的探索对行业具有重要价值,降低成本,也将彻底消灭大模型大规模工业化之路上的拦路虎。
最后,百度有“使命情怀”。核物理学家钱三强曾说过一句名言:“科学没有国界,科学家却是有祖国的。”今天,在国际形势波诡云谲下,科技自立自强日益紧迫,企业则成了科技自主创新的主体。AI革命可能比PC以及互联网对世界带来的冲击更大,AI也将成为跟芯片一样重要的科技制高点,我们国家必须要拥有自主、自立、自强的AI基础技术。中国的AI产业必须跟互联网产业一样依托本土创新崛起壮大,同时不能再有“芯片被制裁”这样的卡脖子问题。
在这样的时代背景下,百度积极承担企业社会责任,用自己的力量推动我国AI科技自立自强。2017年国家发改委批复由百度牵头筹建深度学习技术及应用国家工程实验室,成为 “AI国家队”。百度研发的飞桨是具有完全自主性的深度学习平台,如今百度携文心一言以及文心大模型加速我国AI大模型产业发展,推动AI大模型创新,助力我国AI大模型自立自强。
www.AIGC00.com