为什么靠 ChatGPT 买房可能让你多花 $200,000

Yan Zhu
Co-Founder & Chief Data Officer
General information only — not personal financial, tax, credit, or legal advice
PremiumRea Pty Ltd is a licensed Victorian real-estate buyer's agency. We are not a licensed financial adviser, tax agent, credit provider, mortgage broker, or lawyer, and nothing on this website is personal financial product advice, tax advice, credit advice, or legal advice. Information is general in nature and has been prepared without taking into account your objectives, financial situation, or needs. Before acting on anything you read here, consider whether it is appropriate for your circumstances and obtain independent professional advice from suitably licensed advisers.
See our full disclaimer and terms of use.
我带的团队每天都在用 AI。四十个员工里有五个实际上是 AI 驱动的岗位——找房、HR 筛选、租客沟通。我们大概是整个澳洲房产行业里对人工智能最激进的采用者之一。
所以当我告诉你 ChatGPT 不能替你买房时,我不是在讲外行话。我是站在「知道它具体会在哪里崩掉」的伤疤上讲这句话。
社交媒体上流行一种很诱人的逻辑:「AI 来了,我干嘛还要付钱给买家中介?问 ChatGPT 就行。」Reddit 的帖子里、TikTok 的评论里,甚至一些本不该这么说的人嘴里,我都见过这种说法。每次读到,我心里那个精算师都会做同一道算术题,得出同一个结论。
数学不成立。我把它摆给你看。
没人给你讲的复合错误问题
哪怕 ChatGPT 每一步都有 95% 的正确率——这已经很慷慨了——买一套房至少需要十个连续决策:筛选城区、评估学区、对比近期成交、做估价、制定竞拍策略、审合同条款、查 Section 32 披露、评估建筑状况、谈价、管理交割。
0.95 的 10 次方等于 0.5987。你的整条决策链只有 59.87% 的概率全对。这比抛硬币还差。
AI 工程师给这件事起了个正式名字:compounding error effect(复合错误效应)。每个 token 1% 的错误率,在 200 个 token 上累积,整体错误率会推到 87% 1。这不是空谈。它被观察到、被测量过、被发表过。
落到现实里,Melbourne 的一家 quantity surveying 公司做过一次正经测试。他们把完整数据集和 $100 万澳元的预算交给 ChatGPT,让它推荐投资城区。超过一半的建议是错的。模型偏好公寓而不是独立屋、编造过「days on market」这类指标,有几次甚至推荐了压根不存在的城区 2。
讽刺的是?他们打开 deep research 模式,期待结果变好,结果模型对自己的错答更有信心了。不是错得更少,是「更自信地错」。
Melbourne 独立屋的中位价大约 $900,000 3。我们讲的不是周五晚上选错了餐厅。我们讲的是大多数人一生中会做出的最大一笔财务承诺。而你依赖的工具,在一整条决策链上跑出来的表现,比随机还差。
买家中介能看到、AI 根本看不到的三样东西
有三件事把人类买家中介跟目前任何一个 AI 工具区分开。我不是为保自己的饭碗才这么讲。我这么讲是因为这个差距是结构性的,不是暂时的。
第一件,是「room temperature」(现场温度)。
我不是说温度计读数。我是指你走进一场 open inspection(开放看房)时,用目光数人头的那种感觉:有多少真正在举牌的买家登记了?他们是投资者还是自住买家?是紧张的首置还是老练的选手?
来看一个 Melbourne 西区的真实例子。同一城区、同一周末、四场拍卖。第一场,底价 $850,000,最终以 $1,065,000 落槌——溢价 $215,000——因为现场有七到九个积极举牌的买家。同一天、同一走廊上的其他三场,全部流拍。没人来 4。
如果你那天问 ChatGPT 这个城区一套房值多少,它给你的是中位价。一个数字。但那个星期六下午,真实的范围是中位价上下 $215,000,完全取决于当天谁走进了那个房间。每周跑 40 到 60 场拍卖的买家中介,对现场氛围有一种数据集无法复刻的直觉。
第二件,是「动机」。
同一套房,两种卖家。一方在离婚,需要在圣诞节前拿到现金;另一方在升级住房,愿意等一个好价。面对这两种情况,谈判策略完全不同。一次离婚清算的卖家可能有 $80,000 到 $100,000 的谈判空间,升级换房的卖家可能一分都没有。
我见过溢价房在市面挂了一年,后来因为卖家情况变了,以大幅折扣私下成交。有一套 Melbourne 顶级城区的房产挂牌价 $9.5 million,一年没卖出去,十二个月后私下以 $8.5 million 成交——直接砍掉一百万 5。跟本地 network 打通的买家中介能抓住这种机会,ChatGPT 甚至不知道这套房存在。
第三件,是 off-market(内部房源)通路。
独立行业数据显示,澳洲大约 20% 的房产交易发生在 off-market,而在 Melbourne 某些挂牌量变少的走廊,这个比例可能接近 25% 到 30% 6。这些房产从不出现在 realestate.com.au 上。ChatGPT 没法分析它看不到的东西。
Melbourne 一家中介公司的研究显示,off-market 的卖家平均比公开竞价少接受 $50,000——因为没有竞价场景把情绪价往上堆 7。这 $50,000 的折让直接进了买家的口袋。但前提是买家必须能进入那个 network——而这种通路来自关系,不是算法。
没人提的数据滞后问题
多数人以为,当 CoreLogic 发布 Melbourne 房价中位数时,看到的就是当下的数据。其实不是。
Victorian Department of Treasury and Finance 发布过一份分析,显示主要房产数据公司首次月度发布时,只能捕捉到真实成交量的大约 60%。剩下的 40% 会随着交割上报滞后,在接下来的几个月里慢慢补上 8。
更糟的是,贵价房交割上报得比便宜房快。所以首次发布的中位数不只是不完整——它还会系统性地偏高。你看到的是一个过度反映高端交易、不足反映大多数投资者真正在买的那些城区的数字。
在 Melbourne 活跃的 spring 拍卖季里,活跃城区的中位价可以在几周之内波动 $50,000 到 $100,000。你用 2 月的数据去 4 月的拍卖现场举牌,不只是用了旧信息——你用的是错信息。
一个每周看 40 到 60 套房的买家中介,对价格有一种实时的「体感」,这是任何一份季度报告都赶不上的。我们知道上周六卖了什么、哪些流拍、underbidder 本来愿意出到多少。这不是数据科学,这是田野情报。当你在一套 $900,000 的资产上举牌时,它重要得很。
AI 真正配拿工资的地方
我不是反 AI。考虑到我们在自己运营里用它用得有多重,那样会很荒谬。
AI 在「脏活累活」上非常出色。初步的城区筛选——同时扫 50 个城区的人口增长、租金回报率、基础设施管线、学校排名——人类分析师两周的活,AI 几分钟搞定。
合同条款对比、翻译法律条文、从多个数据库里拉 comparable sales、在不同利率情景下建现金流模型——所有这些事上,AI 比任何人类都要快十倍。
AI 崩掉的地方,是决策链最后那 20%。那些需要物理在场、社会直觉,以及访问非公开信息的环节。关于「这位特定卖家会不会接受比叫价低 $30,000」的判断。关于「这份建筑检查报告是不是在隐瞒某些 inspector 不愿意白纸黑字写下来的东西」的直觉。
聪明的买家用 AI 处理 80% 的准备和研究,把 20%——那些真正决定你是多付 $50,000 还是少付 $50,000 的决策——交给熟悉地形的人。
这不是 AI vs. 买家中介,是 AI + 买家中介。这种组合的威力大到让人吃惊。
你看不到的过度自信陷阱
欧洲一所知名大学的研究者用 500 名参与者做过一个实验。一半人用 ChatGPT 解逻辑题。AI 辅助组得分更高——意料之中。但每一位用过 AI 的参与者,都会大幅高估自己的能力。越是熟练地使用这个工具,高估得越离谱 9。
研究者给这个现象起了个名字:cognitive offloading(认知外包)。你把思考外包出去,信心却留着,结果失去了发现错误的能力。大多数人问 ChatGPT 一个问题,接受它给出的第一个答案,然后从不去核对。
房产上的版本是这样的。有人问 ChatGPT 某个城区是不是好投资。模型返回一段听起来很像模像样的文字,引用中位价、人口增长、基础设施项目。这个人觉得自己「被武装了」。他们到拍卖现场举牌,结果多付了 $40,000,因为他们依赖的「数据」是半年前的陈货,而那些「增长驱动力」是从两年前的新闻稿里扒出来的。
他们从来没意识到自己错了,因为模型讲得太自信。这就是陷阱。
我们团队看过 Melbourne 东南走廊 350+ 宗交易。表现最好的那一批——就算在一个横盘市场里年增值也能超过 15%——在土地与建筑价值比、临近基础设施、卖家动机这些维度上有几个特定的共同特征,目前任何 AI 模型都无法评估。我们发现在资本增值上,weatherboard(木板房)始终跑赢同类的砖房,因为土地价值占比接近 100%,而买家竞争更少 10。这种洞察来自三个小时里复盘 200 个真实案例,不是来自让 ChatGPT 给某个城区做个「总结」。
一套 $900,000 的独立屋,相当于一个普通家庭三到五年的税后收入。它决定你孩子上哪所学校、你每天怎么通勤、你什么时候退休。这不是双十一买鞋,是你家未来二十年财务基石所在。
我每天都在用 AI。正因为我懂它的边界,我知道它做不到什么。尊重自己工具的边界不是软弱,而是省钱的第一步。
我是 Yan,一名从精算师转行做买家中介的人。如果精算师最懂一件事,那就是概率会复合——往两个方向都会。
References
- [1]Wand AI,《Compounding Error in Large Language Models》,2021。分析单 token 错误率在多步推理链上的复合效应。
- [2]MCG Quantity Surveyors,《AI Property Investment Test》,2021。ChatGPT 在 $1M 预算下的城区推荐测试:大部分建议错误,并伪造市场指标。
- [3]CoreLogic,《Monthly Housing Chart Pack — Melbourne》,2021 年 11 月。Melbourne 都市区独立屋中位价。
- [4]Domain Auction Reporter,《Weekend Auction Results Melbourne》,2021。同城区、同周末的拍卖结果因出席买家不同而产生 $215,000+ 的差异。
- [5]Domain,《Prestige Property Market Report》,2021。Melbourne 顶级房产挂牌 $9.5M,挂牌一年后以 $8.5M 私下成交。
- [6]Real Estate Buyers Agents Association of Australia(REBAA),《Off-Market Sales Data》,2021。全国住宅销售中约 20% 发生在 off-market。
- [7]Forge Real Estate,《Off-Market vs On-Market Sales Analysis — Melbourne West》,2021。off-market 卖家平均比同类公开销售少接受 $50,000。
- [8]Victorian Department of Treasury and Finance,《Property Market Data Quality Bulletin》,2021。首次月度发布只捕捉约 60% 的交易,其余在随后几个月补报。
- [9]University of Helsinki,《Cognitive Offloading and AI-Assisted Decision Making》,2021。对 500 名参与者的研究显示,AI 使用者系统性地高估了自己的判断准确度。
- [10]PremiumRea 对 Melbourne 东南 350+ 宗交易的内部分析。土地价值比接近 100% 的 weatherboard 房产在资本增值上持续跑赢同类砖房。
About the author

Yan Zhu
Co-Founder & Chief Data Officer
Former actuary turned property strategist, Yan brings rigorous data analysis and policy expertise to help investors make better decisions.