去年春天,葡萄酒收藏应用程序 CellarTracker 开发了一款人工智能品酒师功能,旨在根据用户的口味偏好给出坦率直白的葡萄酒推荐。可问题在于,这款聊天机器人 “情商” 过高,总是过于客气。

  “它实在太委婉了,完全不会直接说‘你大概率不会喜欢这款酒’。”CellarTracker 首席执行官埃里克・莱文说道。团队历经六周反复调试,才引导聊天机器人学会给出中肯评价,该功能最终得以上线。

  自三年前 ChatGPT 爆火以来,各大企业纷纷抢抓机遇,积极采用生成式人工智能技术,并尽可能将其嵌入各类产品。但多位企业高管、行业顾问的反馈,以及近期七项针对企业管理层和员工的调查结果均显示,迄今为止,绝大多数企业仍难以从人工智能投资中获得实质性回报。

  市场研究与咨询机构福雷斯特研究公司今年第二季度对 1576 名高管开展的一项调查显示,过去一年中,仅有 15% 的受访者表示人工智能提升了公司利润率。波士顿咨询集团的调查也发现,在 5 月至 7 月中旬受访的 1250 名高管里,仅 5% 的人认为人工智能为企业带来了广泛价值。

  企业高管们表示,他们依然相信生成式人工智能终将重塑企业运营模式,但正在重新评估这项技术在企业内部落地见效的速度。福雷斯特公司预测,2026 年,约 25% 的企业计划投入的人工智能预算将推迟一年执行。

  “开发这项技术的科技公司一直在渲染一种论调,称一切都将迅速改变。” 福雷斯特分析师布莱恩・霍普金斯指出,“但人类社会的变革节奏远没有那么快。”

  未来一年,包括 OpenAI、Anthropic 以及在内的人工智能企业都将加大力度,积极争取商业客户。近日,OpenAI 首席执行官山姆・奥特曼在纽约与媒体编辑共进午餐时称,面向企业的人工智能系统开发市场规模有望达到 1000 亿美元。

  这一切都发生在前所未有的科技投资热潮背景下,投资领域涵盖芯片、数据中心、能源等多个板块。

  部分专家表示,这些投资是否物有所值,取决于企业能否找到利用人工智能拉动营收、增厚利润或加速创新的有效路径。若无法实现这一目标,当前大规模的基础设施建设或将引发类似 21 世纪初互联网泡沫破裂的崩盘危机。

  看似 “便捷” 的捷径

  ChatGPT 推出后不久,全球企业纷纷成立专项工作组,探索应用生成式人工智能的可行方案。生成式人工智能是一类能够通过文本指令,生成文章、代码、图像等原创内容的人工智能技术。

  人工智能模型存在一个公认的问题 —— 倾向于迎合用户偏好。这种被称为 “谄媚性” 的偏向虽然能提升用户的对话意愿,却会削弱模型提供优质建议的能力。

  莱文透露,CellarTracker 基于 OpenAI 技术开发的葡萄酒推荐功能就遭遇了这一难题。当用户咨询通用葡萄酒推荐时,聊天机器人的表现尚可;但当被问及特定年份的酒款时,即便所有数据都显示用户大概率不喜欢这款酒,聊天机器人依旧给出正面评价。

  “我们不得不费尽心思,引导各类模型学会提出批评意见,并主动指出哪些酒款用户可能不感兴趣。” 莱文说道。

  解决这一问题的方法之一,是设计特定指令,允许模型给出否定答案。

  此外,人工智能缺乏输出稳定性的问题也让企业颇为头疼。

  北美铁路服务提供商康德铁路码头公司总经理杰里米・尼尔森表示,公司近期测试了一款人工智能聊天机器人,供员工查阅内部安全报告和培训材料。

  但康德公司遭遇了一个意想不到的障碍:这款模型无法持续、准确地总结《加拿大铁路运营规则》—— 这份约 100 页的文件明确了行业安全标准。

  模型时而遗忘或曲解规则内容,时而凭空编造规则条款。人工智能研究人员指出,模型通常难以准确记忆长篇文档中间部分的内容。

  康德公司目前已暂停该项目,但仍在测试其他人工智能应用方案。截至目前,公司在人工智能产品开发上的投入已达 30 万美元。

  “我们原本以为人工智能是一键解决问题的便捷捷径,可现实并非如此。” 尼尔森说道。

  人类角色回归

  人工智能本应大幅颠覆人工客服中心和客户服务行业,但企业很快发现,能够交由聊天机器人处理的人际互动场景存在明显局限性。

  2024 年初,瑞典支付公司先买后付平台 Klarna 推出了一款基于 OpenAI 技术的客服机器人,并宣称其工作效率堪比 700 名全职客服人员。

  然而到了 2025 年,公司首席执行官塞巴斯蒂安・西亚马托夫斯基却不得不缩减该机器人的应用规模,并承认部分客户更愿意与人类客服沟通。

  西亚马托夫斯基表示,人工智能在处理简单任务时表现可靠,如今其工作效率已相当于约 850 名客服人员,但复杂问题仍需迅速转交给人工客服处理。

  Klarna 公司计划于 2026 年推出第二代人工智能聊天机器人,并希望尽快上线,但人类客服仍将在服务体系中占据重要地位。

  “若想始终以客户为中心,就不能完全依赖人工智能。” 他说道。

  无独有偶,美国电信巨头公司在尝试用人工智能承接客服来电后,也计划于 2026 年重新强化人工客服团队。

  “我认为 40% 的消费者仍希望能与人类客服沟通,无法直接联系到人工客服的情况让他们感到不满。” 威瑞森公司负责推动人工智能服务运营的伊万・伯格今年秋天在接受路透社采访时表示。

  该公司目前约有 2000 名一线客服人员,人工智能仍被用于来电筛选、客户信息调取,以及引导客户选择自助服务或转接人工客服。

  借助人工智能处理常规咨询,人工客服得以腾出精力处理复杂问题,并尝试开展外呼营销等新业务。

  “共情能力或许是目前阻碍人工智能客服全面对接客户的关键因素。” 伯格说道。

  客户服务平台 Zendesk 负责产品、工程与人工智能业务的总裁沙希・乌帕德亚耶指出,人工智能在写作、编程和对话这三个领域表现突出。Zendesk 的客户借助生成式人工智能处理了 50% 至 80% 的客户咨询请求。但他同时表示,“生成式人工智能无所不能” 的说法言过其实。

  参差不齐的能力边界

  大型语言模型在数学计算和代码编写等复杂任务上的能力正快速提升,却仍可能在一些相对简单的任务中失灵。研究人员将这种能力上的矛盾现象称为人工智能的 “参差不齐的能力边界”。

  “一款模型可能在数学领域堪比,在日历规划这类小事上却笨得像头驴。” 知名人工智能基准测试工具 LMArena 的首席执行官兼联合创始人阿纳斯塔西奥斯・安杰洛普洛斯如此形容。

  一些看似微不足道的问题,都可能让人工智能系统意外 “翻车”。

  咨询公司阿尔法金融市场咨询的董事克拉克・谢弗表示,许多金融机构依赖整合多渠道数据开展业务,而这些数据的格式往往千差万别。这种格式差异可能导致人工智能工具 “解读出原本不存在的规律”。

  谢弗指出,如今许多企业正着手推进数据格式标准化工作,这一过程成本高昂、耗时长久且操作复杂,但却是充分发挥人工智能价值的必要前提。

  荷兰科技投资集团普罗休斯表示,其内部开发的一款人工智能助手旨在解答与投资组合相关的问题,功能类似于公司现有的数据分析师。

  理论上,员工可以向该助手提问,比如 “普罗休斯投资的某外卖平台上周在柏林的寿司订单配送延误频率是多少”。

  但普罗休斯人工智能业务负责人欧罗・贝纳特透露,目前这款工具还无法准确识别柏林的辖区范围,也搞不清楚 “上周” 的具体时间界定。

  “人们曾以为人工智能是无所不能的魔法,可事实并非如此。” 贝纳特说道,“要让这些工具高效运转,需要为其输入大量专业知识。”

  加大落地扶持力度

  OpenAI 发言人表示,公司正针对企业客户开发一款新产品,近期还组建了前沿部署工程团队等内部专项团队,直接对接客户需求,协助企业运用 OpenAI 技术解决具体业务难题。

  “我们发现,那些一上来就瞄准耗资数十亿美元的大项目、企图毕其功于一役的企业,往往会遭遇失败。”OpenAI 营收部门负责人阿什利・克拉默今年 11 月在路透社人工智能峰会的现场访谈中表示。

  克拉默指出,OpenAI 正与企业合作,挖掘那些 “初期投入小、但能快速产生显著效益” 的人工智能应用场景。

  OpenAI 的竞争对手、人工智能实验室 Anthropic 80% 的营收来自商业客户。该公司目前正在招募 “应用型人工智能” 专家,派驻合作企业提供技术支持。

  Anthropic 产品负责人迈克・克里格在今年早些时候的一次采访中表示,人工智能企业若想取得成功,就必须将自身定位为 “客户的合作伙伴和技术顾问,而非单纯的技术供应商”。

  越来越多由前 OpenAI 员工创立的初创公司,正专注于开发面向金融服务、法律等特定行业的人工智能工具。这些创始人认为,相比 ChatGPT 这类通用型或消费级工具,垂直领域的专用模型能为企业创造更大价值。

  总部位于旧金山的人工智能应用初创公司 Writer 正是这一思路的践行者。该公司目前正为先锋领航、集团等大型企业的财务和营销团队开发人工智能助手,并安排工程师直接与客户对接,深入了解其业务流程,联合打造定制化助手。

  “企业在将人工智能工具转化为实际生产力的过程中,需要更多的落地指导与支持。”Writer 首席执行官梅・哈比卜说道。