当地时间11月9日,微软公司创始人、慈善家比尔·盖茨在其个人网站撰文,阐述了人工智能智能体(agent)在未来几年如何颠覆我们使用计算机的方式。
在人工智能的术语中,智能体是指以智能方式行事的代理,能感知环境,自主采取行动以实现目标,并可以通过学习来提高自身性能。自聊天机器人ChatGPT一年前发布后,有关智能体的研发跨入了快车道。特别是在11月7日,ChatGPT的开发机构OpenAI推出GPTs和GPT商店,允许用户无需编码就可创建自己版本的GPT,从而构建一个智能体平台和生态。这就使一种未来变得更加清晰:人人都能使用自然语言开发软件、拥有多个专属私人助理,像浏览应用一样购买流行的私人助理,就像在苹果应用商店里下载App。
也许是受OpenAI新动作的影响,盖茨随后发表标题为《人工智能即将彻底改变你使用计算机的方式——并颠覆软件行业》的文章,进一步详细描绘了智能体到底会如何改变我们生活的方方面面,以及未来所面临的技术和社会挑战。以下为这篇文章的全文:
今天我仍然像保罗·艾伦和我创办微软时一样热爱软件。但是,尽管从那时起的几十年里它已经有了很大进步,但在很多方面,软件仍然相当愚蠢。
要在计算机上执行任何任务,你必须告诉设备要使用哪个应用程序。你可以使用Microsoft Word和Google Docs起草商业提案,但它们无法帮你发送电子邮件、分享自拍照、分析数据、安排聚会或购买电影票。即使是最好的网站也无法完全了解你的工作、个人生活、兴趣和关系,并且使用这些信息为你做事的能力也有限。这种事情只有在今天与另一个人(例如亲密的朋友或私人助理)合作时才有可能实现。
未来五年,这种情况将彻底改变。你不必为不同的任务使用不同的应用程序。你只需用使用日常语言告诉设备你想做什么。根据你选择与之分享的信息量,该软件将能够做出个性化响应,因为它将对你的生活有丰富的了解。在不久的将来,任何上网的人都将能够拥有一个由远远超出当今技术的人工智能驱动的个人助理。
这种类型的软件可以响应自然语言,并且可以根据对用户的了解来完成许多不同的任务,称为智能体。我对智能体的思考已经有近30年了,并在1995 年的《未来之路》一书中写到了它们,但由于人工智能的进步,它们直到最近才变得实用。
智能体不仅会改变每个人与计算机交互的方式。它们还将颠覆软件行业,带来自我们从键入命令到点击图标以来最大的计算革命。
每个人的私人助理
一些批评者指出,软件公司以前已经提供过这种东西,但用户并没有完全接受它们。 (人们仍然拿Clippy开玩笑,Clippy是我们包含在Microsoft Office中但后来被放弃的数字助理。)为什么人们会使用智能体?
答案是它们会变得更好。你将能够与它们进行细致入微的对话。它们将更加个性化,并且不会局限于写邮件等相对简单的任务。Clippy与智能体之间的共同点就像旋转拨号电话与移动设备一样少。
如果你愿意,智能体将能够帮助你完成所有活动。在获得跟踪你的在线互动和现实世界位置的许可后,它将对你来往的人员、前往的地点和参与的活动有深入了解。它将获取你的个人和工作关系、爱好、偏好和日程安排。你将选择它如何以及何时介入以帮助解决某事或要求你做出决定。
为了了解智能体将带来的巨大变化,让我们将它们与当今可用的人工智能工具进行比较。其中大多数是机器人。它们仅限于一个应用程序,并且通常仅在你写下特定单词或寻求帮助时才会介入。因为它们不记得你每次如何使用它们,所以它们不会变得更好或了解你的任何偏好。Clippy是一个机器人,而不是智能体。
智能体更聪明。它们很主动——能够在你提出建议之前就提出建议。它们跨应用程序完成任务。随着时间的推移,它们会不断进步,因为它们会记住你的活动并识别你行为的意图和模式。根据这些信息,它们会提供它们认为你需要的东西,但最终决定权始终由你做出。
想象一下你想要计划一次旅行。旅行机器人将识别适合你预算的酒店。智能体会知道你一年中的什么时间旅行,并且根据其对你是否总是尝试新目的地或喜欢反复前往同一个地方的了解,将能够建议目的地。当你询问时,它会根据你的兴趣和冒险倾向推荐可以做的事情,并预订你喜欢的餐厅类型。如果你今天想要这种深度个性化的计划,你需要向旅行社付费并花时间告诉它们你想要什么。
人工智能智能体最令人兴奋的影响是它们将使当今对大多数人来说过于昂贵的服务民主化。它们将在四个领域产生特别大的影响:医疗保健、教育、生产力以及娱乐和购物。
卫生保健
如今,人工智能在医疗保健领域的主要作用是帮助完成管理任务。例如,Abridge、Nuance DAX和Nabla Copilot可以在预约期间捕获音频,然后写下笔记供医生查看。
当医疗人员可以帮助患者进行基本分类、获得有关如何处理健康问题的建议并决定他们是否需要寻求治疗时,真正的转变才会到来。这些智能体还将帮助医护人员做出决策并提高工作效率。(像Glass Health这样的应用程序已经可以分析患者的摘要并提出诊断建议供医生考虑。)帮助患者和医护人员对于贫困国家的人们尤其有益,因为那里许多人根本没有机会看病。
这些临床医生智能体的推出速度将比其他领域慢,因为把事情做好是生死攸关的问题。人们需要看到证据证明健康智能体总体上是有益的,尽管它们并不完美并且会犯错误。当然,人类也会犯错,得不到医疗服务也是一个问题。
心理健康护理是智能体将为几乎所有人提供服务的另一个例子。如今,每周一次的治疗似乎是一种奢侈。但还有很多未满足的需求,许多本来可以从治疗中受益的人却无法获得治疗。例如,兰德公司发现,一半需要心理健康护理的美国退伍军人没有得到治疗。
在心理健康方面接受过良好培训的AI智能体将使治疗变得更加经济实惠且更容易获得。Wysa和Youper是这个领域两个早期的聊天机器人。但智能体会走得更深入。如果你选择与心理健康智能体分享足够的信息,它将了解你的生活史和人际关系。当你需要时,它会随时可用,并且永远不会不耐烦。在你的许可下,它甚至可以通过智能手表监测你对治疗的身体反应(例如,当你与老板谈论问题时你的心跳是否开始加速),并建议你何时应该去看人类治疗师。
教育
几十年来,我一直对软件能够使教师的工作变得更轻松并帮助学生学习的所有方式感到兴奋。它不会取代教师,但会补充他们的工作——为学生提供个性化的工作,并将教师从文书工作和其它任务中解放出来,这样它们就可以将更多的时间花在工作中最重要的部分上。这些变化终于开始以激动人心的方式发生。
目前最先进的是Khanmigo,这是可汗学院创建的基于文本的机器人。它可以辅导学生学习数学、科学和人文学科——例如,它可以解释二次方程并创建数学问题进行练习。它还可以帮助教师做一些事情,例如编写教案。长期以来,我一直是萨尔·汗(注:Sal Khan,可汗学院创始人)工作的粉丝和支持者,最近它在我的播客上谈论了教育和人工智能。
但基于文本的机器人只是第一波浪潮——智能体将带来更多的学习机会。
例如,很少有家庭愿意花钱请一位老师来与学生进行一对一的辅导,以补充它们的课堂作业。如果智能体能够掌握辅导老师的有效办法,它们将为每个需要它的人解锁这种补充指导。如果辅导智能体知道一个孩子喜欢《我的世界》和泰勒·斯威夫特,它就会用《我的世界》教它们计算形状的体积和面积,用泰勒的歌词教它们讲故事和押韵的方案。与当今基于文本的辅导老师相比,这种体验将更加丰富(例如图形和声音)并且更加个性化。
生产率
这个领域已经有很多竞争。微软正在将Copilot纳入Word、Excel、Outlook和其它服务中。谷歌正在通过Bard(注:聊天机器人)及其生产力工具Assistant做类似的事情。这些Copilot可以做很多事情,例如将书面文档转换为幻灯片,使用自然语言回答有关电子表格的问题,以及在代表每个人的观点的同时总结电子邮件的脉络。
智能体会做得更多。拥有一个智能体就像有一个人致力于帮助你完成各种任务,并且如果你愿意的话它们可以独立完成。如果你有创业想法,智能体将帮助你编写商业计划、为其创建演示文稿,甚至生成产品的图像。公司将能够为员工提供智能体进行直接咨询并参加每场会议,这样它们就能回答问题。
无论你是否在办公室工作,你的智能体都可以像当今私人助理为高管提供支持一样为你提供帮助。如果你的朋友刚刚做过手术,你的智能体会主动提出送花并为你订购鲜花。如果你告诉它你想和你以前的大学室友见面,它会与他们的智能体一起寻找聚会的时间,并且在你到达之前,它会提醒你他们最大的孩子刚刚开始进入当地大学。
娱乐和购物
人工智能已经可以帮你挑选新电视并推荐电影、书籍、节目和播客。同样,我投资的一家公司最近推出了Pix,它可以让你提出问题(“我喜欢哪些罗伯特·雷德福的电影以及在哪里可以观看它们?”),然后根据你过去喜欢的内容提出建议。 Spotify拥有人工智能DJ,不仅可以根据你的喜好播放歌曲,还可以与你交谈,甚至直呼你的名字。
智能体商不会简单地提出建议,而是会帮助你采取行动。如果你想购买相机,你将让你的智能体为你阅读所有评论,总结它们,提出建议,并在你做出决定后下单。如果你告诉你的智能体你想观看《星球大战》,它会知道你是否订阅了正确的流媒体服务,如果没有,它会主动为你注册。如果你不知道自己想看什么,它会提出定制建议,然后弄清楚如何播放你选择的电影或节目。
你还可以获得根据你的兴趣量身定制新闻和娱乐内容。CurioAI可以针对你询问的任何主题创建自定义播客,让你对即将发生的事情有所了解。
科技行业的冲击波
简而言之,智能体将能够为几乎任何活动和生活的任何领域提供帮助。这对软件行业和社会的影响将是深远的。
在计算行业,我们谈论平台——构建应用程序和服务的技术。Android、iOS和Windows都是平台。智能体将是下一个平台。
要创建新的应用程序或服务,你不需要知道如何编写代码或进行图形设计。你只需告诉你的智能体你想要什么即可。它将能够编写代码、设计应用程序的外观和风格、创建徽标并将应用程序发布到在线商店。OpenAI本周推出的GPT让我们得以一睹未来,非开发人员可以轻松创建和共享自己的助手。
智能体将影响我们使用软件的方式以及软件的编写方式。它们将取代搜索网站,因为它们更擅长查找信息并为你总结信息。它们将取代许多电子商务网站,因为它们会为你找到最优惠的价格,并且不会仅限于少数供应商。它们将取代文字处理器、电子表格和其它生产力应用程序。今天各自独立的业务——搜索广告、广告社交网络、购物、生产力软件——将成为一项业务。
我不认为任何一家公司会主导智能体业务——将会有许多不同的人工智能引擎可用。如今,智能体已嵌入文字处理程序和电子表格等软件中,但最终它们将自行运行。尽管有些智能体可以免费使用(并由广告支持),但我认为你需要为其中的大部分付费,这意味着公司将有动力让智能体代表你而不是广告商的利益工作。如果从今年开始研究人工智能的公司数量来看的话,将会出现异常激烈的竞争,这将使智能体变得非常便宜。
但在我描述的复杂智能体成为现实之前,我们需要面对一些有关该技术以及如何使用它的问题。我之前写过关于人工智能引发的问题,所以这里我将特别关注智能体。
技术挑战
还没有人弄清楚智能体的数据结构会是什么样子。为了创建私人智能体,我们需要一种新型数据库,它可以捕获你的兴趣和关系的所有细微差别,并快速调用信息,同时维护你的隐私。我们已经看到了存储信息的新方法,例如矢量数据库,这可能更适合存储机器学习模型生成的数据。
另一个悬而未决的问题是人们将与多少个智能体进行交互。你的私人智能体会与你的治疗师智能体和数学导师分开吗?如果是这样,你什么时候希望它们互相合作,什么时候它们应该留在自己的轨道上?
你将如何与你的智能体互动?公司正在探索各种选择,包括应用程序、眼镜、吊坠、别针,甚至全息图。所有这些都有可能,但我认为人机交互的第一个重大突破将是耳机。如果你的智能体需要与你联系,它会与你说话或显示在你的手机上。(“你的航班延误了。你想等吗?或者我可以帮你重新预订?”)如果你愿意,它会监控进入你耳朵的声音,并通过阻挡背景噪音、放大难以听到的语音来增强声音,或者更容易理解口音很重的人说话。
还有其它挑战。目前还没有一个标准协议允许智能体相互交谈。成本需要降低,以便每个人都能负担得起智能体。需要更容易地向客服人员提示,以便为你提供正确的答案。我们需要防止幻觉(注:在自然语言处理中,幻觉通常被定义为“生成的内容相对于被提供的源内容而言是无意义或不可信的”),特别是在健康等领域,准确性非常重要,并确保智能体人不会因为偏见而伤害人们。我们不希望智能体做它们不应该做的事情。(尽管我担心的不是流氓智能体,而是人类罪犯利用智能体来达到恶意目的。)
隐私和其它重大问题
当所有这些结合在一起时,在线隐私和安全问题将变得比现在更加紧迫。你将希望能够决定智能体可以访问哪些信息,以便你确信你的数据仅与你选择的人员和公司共享。
但是谁拥有你与智能体共享的数据,以及如何确保这些数据得到适当使用?没有人愿意收到与它们告诉治疗师智能体的事情相关的广告。执法部门可以使用你的智能体作为对你不利的证据吗?你的智能体什么时候会拒绝做可能对你或其它人有害的事情?谁选择智能体中内置的价值观?
还有一个问题是你的智能体人应该分享多少信息。假设你想见一位朋友:如果你的智能体与它们的智能体交谈,你不希望它们说:“哦,她周二要见其它朋友,但不想包括你。”如果你的智能体帮你撰写工作电子邮件,它需要知道不应使用有关你的个人信息或之前工作的专有数据。
其中许多问题已经成为科技行业和立法者最关心的问题。最近,我与其它技术领袖一起参加了由参议员查克·舒默(Chuck Schumer)组织、许多美国参议员参加的人工智能论坛。我们分享了有关这些问题和其它问题的想法,并讨论了立法者采取强有力立法的必要性。
但其它问题不会由公司和政府决定。例如,智能体可能会影响我们与朋友和家人互动的方式。今天,你可以通过记住某人的生活细节(例如他们的生日)来向他们表明你关心他们。但是,当他们知道你的智能体可能提醒过你这件事并负责送花时,这对他们来说还有意义吗?
在遥远的未来,智能体甚至可能迫使人类面对关于目的的深刻问题。想象一下,智能体变得如此优秀,以至于每个人都可以享受高质量的生活,而无需付出同样多的工作。在这样的未来,人们会用时间做什么?当智能体拥有所有答案时,还会有人想接受教育吗?当大多数人都有大量空闲时间时,你能拥有一个安全、繁荣的社会吗?
但我们距离这一点还有很长的路要走。与此同时,智能体正在来到。在接下来的几年里,它们将彻底改变我们的生活方式,无论是线上还是线下。
来源:澎湃新闻