GPT 超越

作者： 2024年10月16日网红浏览

10月16日消息，继上半年千亿参数模型-Large 之后，零一万物正式对外发布最新旗舰模型 Yi-。在国际权威盲测榜单 LMSYS 上，Yi-Lightning 超越o-2024-05-13、Claude 3.5 Sonnet，排名世界第六，中国第一。

零一万物 CEO 李开复博士表示，Yi-Lightning 的出色表现是零一万物“模基共建”战略落地的又一里程碑。作为兼具性能与性价比的新旗舰模型，Yi-Lightning 也将成为零一万物探索“模应一体”的重要基石。

“中国大模型产业进入到了“耐力赛”阶段，如何让大模型赋能千行百业，提升企业新质生产力是一个重要的命题。这不仅将牵涉到“大模型＋行业”的未来发展方向，甚至会影响世界的创新版图。”

我们注意到，这是在 LMSYS 这一全球大模型必争的公开擂台上，中国大模型首度实现“超越 OpenAI GPT-4o ”的最佳成绩。在一众国内模型中，Yi-Lightning 紧随 OpenAI、 Google 之后，与xAI 打平，进击全球前三大模型企业，居世界第一梯队大模型公司之列。

作为模型落地的典型场景之一，翻译场景十分全面地考验了模型语言理解和生成、跨语言能力、上下文感知能力，通过 Yi-Lightning 与Qwen2.5-72b-Instruct、DeepSeek-V2.5、Doubao-pro 的对比，Yi-Lightning 的模型性能也得到了最直观的展现：

Yi-Lightning 在推理速度和推理成本方面同样有所突破——较上一代旗舰模型 Yi-Large ，Yi-Lightning 的最高生成速度提速近四成。在与 GPT-4o 的对比中，Yi-Lightning 的生成速度堪称“极速”：

价格方面，仰赖于自研 AI Infra (AI基础设施) 能力，零一万物将最新旗舰模型 Yi-Lightning 的 API 价格降至极低水平，每百万 token 仅收费0.99元。

据李开复介绍，经过一年多的沉淀，零一万物的“模应一体”战略在 ToB 领域内有了更直观的体现。目前，零一万物已推出了 AI 2.0 数字人解决方案、全行业解决方案、AI Infra 等产品及服务，面向 B/G 端客户构建起了从定制模型到专有应用搭建的一整套解决方案。

基于以 Yi Lightning 模型为代表的 Yi 模型，零一万物搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座，形成了与 AI 1.0时代完全不同的数字人解决方案。

其中，角色大模型为零一万物 AI 2.0数字人提供了动作训练、表情生成等能力，直播声音大模型使得数字人迈过了多国语言和情感表达的门槛，电商话术大模型则成为了数字人主播的“AI 大脑”，负责链接知识库，完成智能对话。

得益于零一万物在文本理解、多模态方面的模型能力，搭载角色大模型与直播声音大模型的零一万物 AI 2.0数字人在形象更为逼真、声音也更贴合垂直场景的需求。

但与AI 1.0时代的数字人相比最为本质的不同点在于，零一万物为 AI 2.0数字人配备了“AI 大脑”——在电商话术大模型加持下，数字人能够基于模型自有知识库与外接数据库，自主生成直播话术，也能够快速、精准地识别直播弹幕的互动意图，给出对应解答。

除直播外，零一万物也为数字人客户准备了 AI 2.0门店短视频解决方案。客户可通过极简流程，随时生成、超低成本和高品质营销视频视频，解决了传统真人短视频的成本和制作周期问题。短视频与直播内容相互配合，为商品提供持续曝光，提升转化率。

据披露，目前，零一万物的 AI 2.0数字人解决方案涵盖了AI伴侣、IP形象、电商直播、办公会议等多个应用场景，合作案例包括全国某著名餐饮连锁、某头部酒旅类客户、全国某知名水果连锁店等，均取得了显著的GMV提升。 其中某头部酒旅企业在接入 Yi-Lightning 全新加持的数字人直播后，GMV 较此前上升170%。

不仅如此，截止目前，零一万物 ToB 解决方案已在零售、医疗、教育、物流等领域内完成落地，涉及 AI 搜索、AI 生产力工具、AI 智能巡检等应用场景。自今年6月开始，零一万物相继宣布与阿里云、360、顺丰科技、飞书、钉钉、钛动科技等企业达成合作，已积累起了一批包含世界500强企业在内的付费企业客户。

据悉，Yi-Lightning 正式接入后，无论是标准化的全行业解决方案，还是更聚焦垂直领域的私有化定制业务，都迎来了更多可能性。（定西）

突破封印！GPT 联网方式一览

揭秘GPT的联网功能

有人憧憬着这样一种AI：它如GPT3般迅捷，如GPT4般全面，联网能力超越BING，输出长度超越Claude2。 GPT4自己透露，它融合了迪迦伽马形态，但受限于黑暗力量，部分功能被封印。

许多GPT PLUS用户对联网限制感到困惑，他们期待的不仅仅是基础的联网，包括GPT Custom instructions模式下的数据访问也受限于旧数据。让我们深入解析GPT的联网现状。

理解联网限制

ChatGPT，作为一种生成式AI，基于深度学习模型，虽能创造内容，但出于道德和安全考量，其搜索功能默认只能搜索至2021年10月前的数据。 GPT3.5、GPT4.0等非BING版本均存在此限制。

联网尝试与局限

GPT3.5通过Web access扩展插件尝试联网，但提供的搜索结果原始且无加工，实际帮助有限。 GPT4的联网功能曾短暂开放，随后下线，目前仍未恢复。 BING则凭借实时搜索能力在搜索领域表现出色。

API与融合策略

最可行的方法是结合使用，例如BING和GPT4。首先，通过BING获取最新数据，然后将结果提供给GPT4进行深入分析或生成。例如，通过API在PLUS用户权限下，可以将数据转化为可视化的图形输出。

总结

尽管存在限制，通过巧妙的组合，我们可以利用GPT的潜力，但联网功能的提升还需等待官方进一步的更新。对于联网需求，目前BING与GPT4的结合是最有效的方式，尤其是对PLUS用户来说。

预训练语言模型之GPT-1，GPT-2和GPT-3

OpenAI的GPT系列预训练语言模型，从最初的GPT-1到最新的GPT-3，以其强大的无监督学习和微调能力在NLP任务中展现出惊人的效果。这一系列模型的核心是Transformer架构，通过不断增大训练语料、参数数量和计算资源，实现了性能的提升。 GPT-1通过无监督预训练和有监督微调，能够处理多样化的任务，并在一些零样本任务中表现出强大的泛化能力。 GPT-2则进一步通过多任务学习，利用更大的数据集和更多参数，验证了词向量模型的广泛迁移能力，但仍有提升空间。 GPT-3作为系列中的巅峰之作，其[公式] 亿参数和海量训练数据使其在零样本或少量样本学习下就能展现出超越现有方法的性能，涉及领域广泛，如文章生成、代码编写等，但也存在局限性。然而，GPT-3的高计算成本引发了关于AI技术垄断和资源分配的讨论。总的来说，GPT系列的发展展示了语言模型在AI领域的巨大潜力，同时也推动了硬件性能的提高，预示着AI技术的持续进步。

超越GPT-3，浪潮源中文巨量语言模型开源了！现在放出免费API，人人皆可用。

浪潮人工智能研究院日前发布了一款超越GPT-3的中文巨量语言模型“源1.0”，它以2457亿的参数量成为全球最大的AI模型。这款模型在语言智能领域表现出色，尤其在CLUE评测基准的零样本学习和小样本学习中获得多项冠军，甚至在成语阅读理解填空上超越了人类得分。为了让更多用户受益，源开放平台于2021年10月上线，提供免费API服务，支持内容创作、翻译、问答等多种功能。用户只需通过注册、申请、审核，即可获得3个月、次的API使用权。注册过程包括填写基本信息、API申请和数据集申请，审核通过后，用户可以通过图形化或代码方式使用API，无需编程基础即可体验源模型的能力。对于数据集，用户可以申请1TB的高质量文本数据，通过邮寄方式领取。若API使用权限到期，用户可申请延期，每次延期3个月。源开放平台支持Web页面和Python调用，对于任何问题，用户可通过air_邮箱或添加工作人员微信获取帮助。现在就注册（）并开始体验这个革命性的中文认知智能工具吧！