当前位置:首页 > 软件资讯 > 率先全面开放,文心一言为何一骑绝尘?

率先全面开放,文心一言为何一骑绝尘?

分区:软件资讯 更新:2023-09-04 09:22:27

连续两天,半夜爆出大新闻。一是华为新机深夜上线,让国产芯片替代的步伐更进一步;第二天晚上,百度文新宣布全面对外开放——两大新闻直接引爆科技圈。

8月31日凌晨,百度官方公众号发布推文,称“文易欣颜面向全社会开放”。用户可在app store下载“文颜APP”或登录“文颜官网”体验。包括百度文心伊彦在内,共有8家大型企事业单位模型在首批名单中,可正式上线为公众提供服务。值得注意的是,被视为文心伊彦竞争对手的阿里通易乾文、360智脑、讯飞星火并不在首批获批名单中。

随后,“文心伊彦APP”在各大应用商店冲上热门榜,在苹果应用商店直接登顶免费榜,成为当日热门应用,这无疑让百度再次独占鳌头。

此前,在获得备案和审批之前,各家公司只能在小范围内进行内测,用户需要“排队”申请内测资格,这极大地限制了大型号在用户层面的推广。现在大车型备案审批全面开放,大车型步伐有望进入下一阶段。

秉承技术自主的理念,在自主技术研发上投入了巨资的百度和华为,可以说是殊途同归,而软硬件领域的“双子星”则共同推动技术投入“开花结果”。

坚守技术,换来的是厚积薄发。

大模型在国内掀起了新一代技术浪潮,迅速席卷整个互联网,百度在大模型赛道的步伐上一直领先。2019年,文心大模型首次发布。2023年,大型语言模型“文心易雅”首次在大厂推出,现率先获得批准、认可,并正式向全社会开放。

百度之所以快速踩大模式的全球技术风口,是基于百度强大的技术基础。

早在2010年,百度就已经开始布局AI相关技术的研发。十年来累计研发投入超过1400亿元。其中,2022年研发支出高达214.16亿元,占百度核心营收的22.4%。与世界其他大厂相比,这些投资也是名列前茅的。

随着高额R&D成本的持续投入,近年来,从最初深度学习等基础技术的探索,到AI在互联网等场景的推广,再到如今扎根千万行业,大力推进AI的产业化生产,百度不仅完成了芯片、框架、模型、应用四层架构对应的自研技术积累,更具备了作为AI基础设施供应商的前提条件 并成功引领AI技术成果在产业层面的实践,降低了人工智能发展和应用的门槛。

这也使得百度在技术专利、技术产品、技术应用上占据领先地位。在专利方面,根据国家工业信息安全发展研究中心、工信部电子知识产权中心发布的《中国人工智能专利技术分析报告(2022)》,百度AI专利申请量为1.68万件,连续五年位居国内第一;在专利授权量方面,百度仍以5705件专利授权量排名第一。

文心一字大模式是百度多年技术积累和产业实践的自然结果。基于技术和实践的领先优势,文心一字大模型问世不到半年,在国内外多家研究机构、权威媒体、高校发布的大模型评测报告中均有不俗表现。

例如,IDC最新发布的《2023年AI大模型技术能力评估报告》显示,百度文心大模型3.5在12项指标中获得7项,综合得分第一,算法模型第一,行业覆盖第一。其中,算法模型是大模型能力的核心要素,百度文心大模型在这个维度拿到了唯一的满分。

更让外界欣慰的是,从评测来看,百度文新的大模说话能力从5月份开始不断提升,正在逐步追赶国外的大模。

百度“AI大基”的全栈能力,助力文心进化。

31日凌晨全面开放后,百度文心伊彦app迅速飙升至Apple Store免费榜榜首,成为首个登顶App Store的中文AI原生APP。

用户的反应透露出对文心强大进化能力的期待。自今年3月发布以来,文心安逸成长迅速,掌握了200多个创作体裁,内容丰富度是初发布的1.6倍,思维链长度是初发布的2.1倍,知识点覆盖度是初发布的8.3倍。在一些大众评测中,文心大模型3.5版本支持的文心,中文口语能力突出,甚至超过GPT-4。

这很大程度上得益于百度的飞桨。百度有自主研发的深度学习平台,有力支持大模型的高效训练和推理。通过飞螺的端到端自适应混合并行训练技术,以及压缩、推理、服务部署的协同优化,文心大模型训练速度达到3倍,推理速度达到30倍以上。

飞桨和文心,一个是框架平台,一个是大模型,这只是人工智能技术体系中的两个重要层。它们之间有很强的协同优化潜力,所以飞桨领先的训练技术可以优化大模型的训练效率。

百度不仅拥有框架层和模型层的关键技术。人工智能时代,IT技术的技术栈发生了根本性的变化,从过去的三层变成了“芯片-框架-模型-应用”的四层,而百度是全球为数不多的全栈布局的人工智能公司。从高端芯片昆仑芯,到飞桨的深度学习框架,再到文心预训的大模型,以及搜索、智能云、自动驾驶、小度等应用,各个层面都有领先行业的关键自研技术。

比如框架层面,百度从2016年开始开放了摇橹深度学习框架。目前,该框架已经集成了深度学习的核心训练和推理框架、基础模型库、端到端开发工具包等工具组件,在中国市场份额排名第一。

全栈布局的优势在于,在technology stack的四层架构中,可以实现端到端的优化,大大提高效率。飞桨和文心词的优化就是最典型的例子。此外,芯片、框架、大模型、终端应用场景也能形成高效的反馈闭环,帮助大模型不断调优迭代,越来越好。

例如,文易欣燕与诸如搜索和信息流的应用层合作。百度的搜索服务每天响应数十亿真实用户需求,每天进行1万亿次深度语义推理和匹配,能够提供最真实及时的反馈,从而倒逼大模型、深度学习框架和芯片的优化。相比之下,文新词应用于搜索也会带来搜索的变化。

除了全栈开发的“AI大基”,百度AI云推出的两个AI工程平台“AI中间平台”和“百度白鸽AI异构计算平台”,也分别在开发和资源层面提升了效率,加快了培养进程。这为文心的成长提供了最坚实的技术支撑,也成为他赶超国外大模特的信心。

核心能力升级,百度加速大模型落地时代的到来。

在5月底举行的2023万象百度移动生态大会上,百度搜索宣布“AI合伙人”开始内测。这个全能的“Al伙伴”可以理解用户的任何问题,与语音进行交互,帮助用户标记答案中的关键点,并提供权威来源。在演示中,“Al Partner”提供了一份完整的人工智能大会演讲。

百度各种用户端产品正在利用大模型进行重构,基于大模型基座和云平台的开发生态建设也在同步推进。不久前,在百度主办的2023浪潮峰会上,推出了“超级助手”和“科玛特X智能编程助手”。

理解、生成、逻辑和记忆构成了一个人工智能或通用人工智能系统最基本的能力。从文心词在C端和B端应用的表现来看,这四大核心能力都在快速提升,而其背后展现的则是百度在知识增强、检索增强、对话增强方面的关键技术能力和差异化优势。

基于庞大的知识图谱和搜索对真实数据和用户需求的理解,是百度多年来构建技术护城河、打造内容生态的基础。因此,作为百度自主研发的知识增强语言模型,文心安义在知识增强和检索增强方面天然具有优势。

据悉,百度文心模型拥有全球最大的知识图谱,包括50亿个实体,5500亿个事实,每天被调用超过400亿次。

在对话增强方面,百度在对话技术上已经深耕多年。不久前,由王海峰领衔的“知识与深度学习融合的通用对话技术及应用”成果获得“2022吴文俊人工智能科学技术进步奖”,这是该奖项设立以来颁发的首个特别奖。对话技术所涉及的记忆机制、语境理解、对话策划能力,可以帮助文心达到更好的对话连贯性、合理性和逻辑性。

百度构建了多种针对中文的训练数据、服务应用和丰富的知识,在人力反馈、奖励模型和策略优化之间建立了飞轮机制。随着真实用户的反馈越来越多,文心话的效果会越来越好,能力也会越来越强。

如今,文新伊彦率先向用户全面开放,意味着未来我们可以在现实世界中获得更多的人工反馈,这将进一步完善基础模型,帮助文新伊彦加速迭代,提升能力。而且用户层面的放开,会刺激大模型的竞争焦点转向应用层,激发应用开发的创造活力。基于文心的领先,百度未来将率先带来杀手级应用,真正引领大模式进入落地时代。

这也是用户希望从这场技术浪潮中看到的,弯道超车,占领新一代技术变革的制高点。

  • 最新资讯
  • 最新软件