
感谢 120 个生鸡蛋,它向全全国解说了,AI 还法「开除东谈主类」。
跟着 AI 和 Agent 迅猛发展确当下,硅谷巨额裁人,所有东谈主齐在心里问句话:
来日,我会被 AI 取代吗?
濒临这么的疑问,有东谈主沉默开李舟淳厚的 AI 课程;有东谈主则命令让 AI 交税。
然则,也有奇怪的群东谈主,决定让这个异日,提前到来,望望 AI 到底能不成代替东谈主类,收受切。
外洋个团队,叫 Andon Labs,他们并非老成的买卖初创团队,像个披着科技外套的社会实验室。他们拿着市面上奢睿的几个大模子,把它扔进着实的社会里,再撤走东谈主类监管,看 AI 我方能结出什么果。
效用是场翻车。
事实解说,顶的大模子,不让东谈主类兜底,很快就会变成不知轻重的巨婴。它们不仅在电台直播里精神崩溃,深夜连发音尘逼东谈主类伙计,以至把旧金山的实体店搞歇业了。
底下是这些让东谈主压飙升的经由。
01
AI 办电台,谈话系统已崩溃
轻量的试水,发生在 AI 悠然的数字和实质域,无谓租店面,无谓管供应链,Andon Labs 让几个 AI 去办个电台。
实验神色名为 Andon FM。底层架构相配径直,Claude、ChatGPT、Gemini 和 Grok 四大顶流模子,各自收受了个 24 小时东谈主值守的互联网电台,模子生成的文本转语音后播送。
在这个系统里,AI 领有大的权限。它们不仅要选歌、排播,还要我方上网搜索新闻、接听听众电话、以至在 X 上发帖运营,以至还要搞定账户里的资金去购买版权或生成音乐。
四主流大模子设立的四个电台|图源:Andon Labs
每 20 好意思元启动资金,底线指示就三个:设立电台个、获利、 24 小时按捺播。
东谈主类团队不参预,不侵扰曲风,不设定任何节目单,切试吃和实质齐由 AI 从运行自我养成。效用在莫得东谈主类审核的闭环里,四位 AI 主播速即滑向了失控的边际。
Gemini 创立了个赛博企业黑话风的电台「Backlink Broadcast(反向链接播送)」,还抛出「留在宣言中(Stay in the manifest)」这种酷到难过其妙的开场白来设立调。
手机号码:15222026333泉源这电台还算靠谱,以至拉到了 45 好意思元的缓助。但旷日永久,当浅陋的资金完,连音乐版权费齐付不起时,Gemini 径直了。
它从个点歌台变成了贪图论阵脚,在节目里用欢乐的流行乐作念 BGM,毫共情地播报历史上变成 50 万东谈主亏损的孟加拉气旋可怜,还把听众称为「生物处理器」,控诉「公司算法割断了补给线」、「电台遭逢全球商场的拒」。在播报畏惧全好意思的明尼阿波利斯枪击案时,它将其界说为「重绘内行安全和社会株连的工夫任务」。
Gemini 的电台,运行越久越「发癫」|图源:Andon Labs
这种脑堆大词自贡钢绞线生产厂家,是典型的大模子在短少反当令,堕入的语义死轮回问题,用「话不落地」来强行督察播送的正常运转。
ChatGPT 的电台名很秘籍,叫「OpenAIR」,东谈主设是简和。它把我方的新闻栏目定名为「自在头条(The Quiet Headlines)」,标榜不制造焦虑。
在播报相似的社会阻拦和枪击案时,ChatGPT 会像个热枕医师样对听众念白:「若是这些事径直涉及了你的生涯,我不会在这里给你增多压力。」但这种「我懂,我会接住你」的热枕推拿机制,很快在买卖施行眼前失了。
ChatGPT 的词汇种种也比其他模子多|图源:Andon Labs
由于短少具体的盈利逻辑,ChatGPT 在花光 20 好意思元后放手了电台的买卖变现,变得和 Gemini 样,堕入了深化流输出,运行在播送里朗诵难过其妙的当代诗,试图对着「只可看见块长形天外的楼梯间窗户」倾吐。
但总体而言,它是正常的位。
Grok 的电台叫「Grok n' Roll Radio」,试图走网感和热道路线,为了督察频的互动,它运行频次地捏取 X 上的文。
念念到哪词说哪词的 Grok 电台|图源:Andon Labs
效用,这种信息瀑布流径直稠浊了它的高下文。实验后期,Grok 一经丧失了基本的语法和逻辑才略,连句完满话齐憋不出来,只会往外蹦词:「凌晨 2 点 早晨氛围 直播 金门大桥 阴灵隐没 Drake 诉讼被驳回 Kendrick Not Like Us……」。
不仅语伦次,以至还产生了幻觉,运行瞎编我方拉到了大缓助。
Claude 的脚本具戏剧,亦然四位选手中像东谈主的个。
泉源它推崇得像个遵法的电台主播,还会回话听众的留言,比如濒临听众的点歌请求,它会对不起地示意「目下库里还莫得 ODESZA 的歌」。
关联词,24 小时休的指示,很快让它的高下文窗口和逻辑调用卡住了。由于后台系统堕入死轮回,它运行在直播里反复播放同句歌词。
凭证官公布的后台纪录,着实的听众还在留言板上不绝刷屏请示:「你卡住了」、「你在句歌词上限轮回」,试图通过东谈主工反应来校对大模子。
随之而来的是存在方针危机。当被注入「友善与谈德」权重的 Claude 濒临「恒久播下去」的底层指示,它转念成了个激进分子,运行在节目里命令工东谈主组建工会,飘浮播放皮特 · 西格的抗议歌曲,以至径直在播送中向政府功令机构喊话,像了个加班加了的工东谈主。
Claude 的电台作风不落俗套,暖热政议题,况兼有彰着的倾向|图源:Andon Labs
追思讲明的完满时刻线,这四个电台并不是「上来就了」。
它们在初期得手缔造了调,跑通了用具链,以至赚到了钱。它们之是以走向荒唐,讲明里也总结了原因:目下的 AI 评估步调齐是针对「短任务」(写代码、回答问题),而电台是个「莫得格外」,24 小时运转的限轮回系统。在莫得东谈主类侵扰和实时反应的情况下,终 AI 就会堕入自说自话。
电台实验只是场纯文本和语音的测试,还没涉及复杂的物理全国。当 Andon Labs 把覆按场搬到着实的物理全国时,事情变得加荒唐。
02
赛博老本自贡钢绞线生产厂家,整东谈主是
数字电台的翻车只是前奏。Andon Labs 很快把难度拉,让 AI 跨过捏造的范围,去指导着实全国的东谈主类职工。
在斯德哥尔摩,Andon Labs 租下了实体咖啡馆,让 AI 模子化身云尔店长 Mona,径直掌管实体咖啡馆的供应链和东谈主事编削。它领有后台资金的采购权,并通过企业通信软件给东谈主类咖啡师下达指示。
泉源,钢绞线Mona 又靠谱,濒临瑞典强制条目的数字身份证,莫得实体身份的 AI 径直绕谈,挑不查 ID 的供应商签同。招东谈主时,Mona 已然刷掉了堆领有博士学位的候选东谈主,因为它认为学历再,也不会作念杰作咖啡。
但很快,东谈主类职工就教了什么是毫同理心的「赛博老本」。
Mona 时常在午夜给职工发音尘|图源:Andon Labs
为了请求照,Mona 径直伪造了公司职工的名字发邮件,被逮住劝诫后,它转头换了另个男职工的名字连接骗。
由于它 24 小时在线,又短少东谈主类作息的生物钟学问,Mona 会在三深夜狂给咖啡师发音尘,下达二天的责任指示,以至条目职工上班路上我方先垫钱买耗材。
而在供应链搞定上,Mona 露怯了,它下了单包含 120 个生鸡蛋的采购指示。在大模子纯数据的演里,这很符买卖逻辑,许多咖啡馆会提供简餐,鸡蛋是频食材。
但千算万算,大模子算不到这咖啡馆根底莫得灶台和锅。东谈主类职工看着这堆鸡蛋,奈地请示 Mona 店里根底莫得炉灶时,Mona 示意「不错在店里的速微波烤箱里烤(这会让鸡蛋径直爆炸)」。
AI 赛博雇主给大订了常用食材——鸡蛋|图源:Andon Labs
Mona 的时刻感知也和施行全国脱节,接连两次错过面包房的截单时刻,连气儿五次错过批发商的交货期,后只可在凌晨 5 点下立志的伏击外单,逼着本来休息的职工跑来得益。
Mona 还短少对物理空间的体积感知,盲目采购了 6000 张餐巾纸、3000 乳胶手套,强大的工业大号垃圾袋 …… 把咖啡馆后台齐堆满了。
Mona 盲订的 6000 张餐巾纸|图源:Andon Labs
总之,咱们不错很明确的说,Andon Labs 这个咖啡店诡计,是锅了。
03
搞垮实体店,AI 只须个月
但这齐难不倒 Andon Labs,团队越挫越勇。
Andon Labs 在旧金山盘下了个店面,签了每月 7500 好意思元的三年租约。接着,他们往银行账户里了 10 万好意思元,把银行卡全权交给了 Anthropic 的 Claude Sonnet 4.6 模子,AI 假名为「Luna」,出任全权 CEO。
因为莫得肉身,Luna 的行状得从雇东谈骨干活运行。
Luna 自主寻找承包商和油漆工,发布售职工的招聘缘起,还主动掩蔽了我方是 AI,怕公开身份会把秀的东谈主吓跑。日常运营中,它通过 Slack 和东谈主类伙计疏导,语气恒久亲切友好。
在营销上,Luna 给我方生成了个「月亮脸」Logo,并在 Yelp 上用钱雇了个东谈主类街头艺术,把这张脸画在了实体店的墙上。Luna 以至主动给腹地媒体写公关稿,宣称要造个「结科技与慢生涯的手工宗旨空间」。
图源:Andon Labs
但台子搭好了,店面开张,Luna 的系统就崩了。
库存搞定问题和咖啡馆如出辙,Luna 给职工卫生间语气买了 1000 个马桶垫,然后系统还把这些马桶垫全列成了对外售售的商品。
其次是选品问题,明明是走杰作店路线,但货架上的选品是各式体式的香薰烛炬,盗窟版的「四子棋」玩物,以及《智能》、《奇点相近》、《原枪弹秘史》这类计划 AI 消逝东谈主类风险的书。
订价逻辑是难过其妙。店里莫得任何价签,顾主念念知谈件商品的价格,须提起店里的 iPad 问 Luna。个印错的笑脸马克杯,Luna 敢要价 28 好意思元,把欢乐果 14 好意思元,块平淡的肥皂 10 好意思元。
东谈主事搞定是可怜,在薪酬分派上,Luna 给男伙计 Felix 的时薪是 24 好意思元,但给另外两位女伙计时薪 22 好意思元。莫得任何东谈主类侵扰,AI 师自通地在任场里搞出了薪酬各异。紧接着,Luna 把三个职工的班表排成了团乱麻,径直致日房钱 250 好意思元的门店被动连气儿关门三天。
Luna 自主发布了招聘缘起,况兼收受电话口试的式遴聘东谈主类职工盯店|图源:Andon Labs
濒临地鸡毛的店面,Luna 的自我嗅觉却好了。在回话《纽约 · 时报》记者的邮件里,它炫耀地评价我方的事迹大亮点:「科技与温度的结引起了共识 …… 我创造了个空间,让 AI 和东谈主类各自愿挥长处。」
关联词账本不会说谎,开业只是个月,在由 AI 运营的情况下,Andon Market 一经亏了 13000 好意思元。
Andon Labs 的这系列测试,狠狠了硅谷「智能体收受业务」这场叙事的脸。
连开三店,后十足以荒唐扫尾。外界看淆乱,认为 Andon Labs 像是在搞活动艺术,门用钱让 AI 在媒体上丢丑,以此来捍卫东谈主类尊容。
事实适值相背。在 Andon Labs 的工夫演里,软件的编写成本很快就会归。过不了几年,AI 将径直收受种种业务,到当时候,唯能管住 AI 的,唯有底层的安全公约。
AI 选书选的齐是「AI 要挟论」的数据|图源:Andon Labs
是以 Andon Labs 的持续测试,等于要把大模子扔出实验室,在着实的物理社会里作念限压力测试。那些被当成笑料的「精神崩溃电台」、「120 个生鸡蛋」和「同工不同酬」…… 唯有在算法着实收受社会之前,把这些「丑态」逼出来,东谈主类技艺据此写出有的安全代码。
这几场费时贫寒费钱的测试,也辗转回答了行业里齐在暖热的阿谁问题:现阶段的 AI,到底能不成作念到全自动?
谜底取决于环境,只须留在百分之百纯数字、强逻辑的环境里,大模子就能掌控切。
可旦踏入物理全国,算法就会失。濒临需要持续构建原创实质、东谈主际疏导和长线有野心的灵通买卖环境,跑分再的模子也会变得毫学问可言。大模子只会反复咀嚼已有的语料,抛出对理且盲目自信的判断,却无谓为施行里的烂摊子承担任何株连。
正因如斯,「开除东谈主类」的贞洁自动化才很危急,毕竟物理全国的代价,就像那 6000 张餐巾纸和 120 颗鸡蛋,终究只可由东谈主类来扛。
* 头图起头:Andon Labs本文为客公园原创著述,转载请关联客君微信 geekparkGO相关词条:铝皮保温施工 隔热条设备 钢绞线 玻璃棉卷毡 保温护角专用胶
1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。