10万次Claude真实对话洞察,AI平均可缩短工作任务时间约80%
创始人
2025-11-26 13:00:31
0

IT之家 11 月 26 日消息,Anthropic 昨日(11 月 25 日)发布研究报告,通过分析旗下 AI 模型 Claude 的十万次真实对话,发现任务完成时间平均缩短约 80%。

量化 AI 对生产力的真实影响

该研究目的是量化 AI 在真实工作场景中对生产力提升的具体效果。研究团队采用了一种保护用户隐私的分析方法,抽样分析了十万次来自 Claude.ai用户的真实对话记录,通过让 Claude 估算这些对话中涉及任务的完成时间,研究人员得以对比有无 AI 协助下的效率差异。

本次研究目的是量化 AI 在真实工作场景中对生产力提升的具体效果,上图为相关研究方法。

根据 Claude 的估算,如果没有 AI 协助,用户处理的这些任务平均需要 90 分钟才能完成,而在 Claude 的帮助下,任务完成时间平均缩短了约 80%。

这些任务大多较为复杂,例如法律咨询、企业管理等,平均耗时接近两小时;而一些较简单的任务,如餐饮筹备,耗时则在 30 分钟左右。

研究还发现,AI 在不同领域的提效能力存在差异,例如在医疗辅助任务中,AI 能将效率提升 90%,但在硬件问题处理上,效率提升则为 56%。

Claude 估计的人工完成时间在不同提示语下表现出高度相关性。提示语 1 要求 Claude 估计“具备相应技能的员工”完成任务所需的时间,提示语 2 则询问“在相关领域具备胜任能力的人员”完成任务所需的时间。这两个提示语的对数相关系数为 0.89,表明两者高度一致。

各项数据均源自 Claude 对 SOC 主要群体的时间估算。不同职业的人工时间估算差异显著 —— 人们使用 Claude 处理管理和法律事务时,预计需要大约 2 小时才能完成(无需人工辅助),而医疗保健支持和食品准备等任务平均只需半小时左右。职业类别的平均时薪数据来自 OEWS 2024。平均任务成本的计算方法是:将每个职业的时薪乘以其任务时间的中位数,然后根据每个任务在我们样本中的普遍程度进行加权平均。节省时间的计算公式为: 1 - time_withai / time_without_ai 。

Claude 估算了九项不同任务的任务时间、该职业的平均时薪、隐含任务成本以及节省的时间。任务时间的估算方法是让克劳德预测专业人员在没有人工智能辅助的情况下完成任务所需的时间。时薪数据来自 2024 年 5 月的职业就业和工资统计(OEWS)。任务成本的计算方法是将任务时间乘以时薪。节省的时间的计算方法是估算人类完成任务所需的时间,然后计算公式为:1 - time_with_ai / time_without_ai 。当前 AI 或使美国劳动生产率年增速翻倍

研究团队将这些任务层面的效率提升数据外推至整个美国经济。他们使用标准经济学模型进行测算,结果表明,如果普及当前一代 AI 技术,有望在未来十年内推动美国劳动生产率实现 1.8% 的年均增长。

这一数字几乎是美国自 2019 年以来年均增长率的两倍,也处于近期同类研究预测范围的上限。不过,研究人员强调,这并非对未来的精准预测,因为它并未考虑 AI 模型的普及速度以及未来技术进步可能带来的更大影响。

软件开发、管理等知识密集型行业受益最大

数据显示,AI 带来的生产力提升主要集中在知识密集型行业。其中,软件开发人员的贡献最大,占总生产率增益的 19%。紧随其后的是运营经理(约 6%)、市场研究分析师(5%)、客户服务代表(4%)和中学教师(3%)。

相比之下,餐饮、医疗服务、建筑和零售等行业的任务在数据样本中占比较低,因而从当前 AI 应用中获得的直接生产力提升也相对有限。

AI 加速部分任务,但存在局限性

该研究还指出了一个重要现象:AI 能够显著加速某些特定任务,但对其他任务的帮助则相对有限。例如,AI 可以帮助软件工程师高效编写代码和文档,但对于协调系统安装、监督工程师等任务却作用不大。

这意味着,随着 AI 普及,那些难以被 AI 加速的“瓶颈”任务,可能会在整体工作流程中占据更大比重,从而成为制约生产力进一步增长的关键因素。

Anthropic 承认该研究存在局限性。首先,Claude 的估算并非完美,且无法核实用户在与 AI 对话之外所花费的额外时间(如验证 AI 生成内容的准确性)。其次,模型假设 AI 被普遍采用,而这在短期内难以实现。

尽管如此,这项研究建立了一套可持续追踪 AI 经济影响的测量框架。随着 AI 技术不断进步和应用范围扩大,该框架将为我们理解 AI 如何重塑经济提供一个动态且宝贵的视角。

IT之家附上参考地址

相关内容

热门资讯

打造共享用工与技能人才服务高地 来源:滚动播报 (来源:唐山劳动日报) 本报讯 (王雪纯、马佳明)近日,河北省“技能照亮前程”职业技...
东北老工业基地转身:AI进厂,... 近日,时代周报记者跟随工信部“新型工业化媒体调研行”走访辽宁沈阳、大连两地,厂房里的景象正在刷新外界...
HDC 2026正式开幕,华为... 6月12日,华为开发者大会在东莞正式启幕,在现场的我给大家分享一组鸿蒙生态最新喜讯:HarmonyO...
5名高中生“手搓火箭”发射成功... 5名高中生“手搓火箭”发射成功,合作机构回应质疑:手续完备,系成熟技术搭配“学生想法”完成;去年就有...
宏大时代取得井下无轨运矿车换电... 国家知识产权局信息显示,福建宏大时代新能源科技有限公司取得一项名为“一种井下无轨运矿车换电系统”的专...
鸿蒙加码武汉,多个项目落地! 当软件不再只是代码,硬件不再只拼算力,一场横跨芯片、装备、操作系统的“软硬协同”变革正在武汉加速上演...
2026年将至,好用的VERT... 在科技飞速发展的今天,手机市场竞争异常激烈。VERTU作为奢侈手机的代表品牌,以其卓越的工艺和高端的...
美国又对全球通讯命脉“卡脖子”... 中新经纬6月13日电 (张芷菡)你知道吗,你跨境网购、和海外亲友视频通话,都与一条条“光通道”有关。...
国外量产的固态电池爆雷了 最近有一个消息,不知道大家看了没有? 2026年初宣称已经实现固态电池量产的那家芬兰公司Donut ...
原创 红... 红米在智能手机上,已推出数字系列、Turbo系列、Note系列、K系列,实现多层次覆盖。最高自然是K...