ChatGPT 能准确评估 Melbourne 的房产价值吗?

不能。quantity surveyor 的测试显示,ChatGPT 超过一半的时候推荐了错误的城区、伪造了市场指标,甚至建议过根本不存在的城区。复合错误效应意味着一条 10 步的房产决策链上,每步 95% 的准确率会把整体准确率拉到 59.87%——比抛硬币还差。

Melbourne 有多少比例的房产是 off-market 成交的?

行业数据显示澳洲约 20% 的住宅销售全国性地发生在 off-market。在挂牌量减少的 Melbourne 走廊,这个比例可能接近 25-30%。由于缺少竞价压力,off-market 卖家通常比同类公开销售少接受约 $50,000。

CoreLogic 的房产数据对买家有多可靠?

CoreLogic 首次月度发布只捕捉大约 60% 的实际交易,剩余 40% 会在之后几个月补报。贵价房上报得比便宜房快,导致公布的中位价存在向上偏误。在旺季,中位价几周内就可能波动 $50,000 到 $100,000。

买房应该用 AI 还是用买家中介?

最优做法是两者结合。AI 擅长初步研究——同时筛选 50 个城区、对比成交数据、分析学区。但决策链最后 20% 的环节——评估卖家动机、读拍卖现场氛围、进入 off-market 通路、实时价格谈判——需要人类的判断和关系网络,AI 无法复刻。

AI vs 买家中介 Melbourne | 为什么 ChatGPT 搞不定房产

我带的团队每天都在用 AI。四十个员工里有五个实际上是 AI 驱动的岗位——找房、HR 筛选、租客沟通。我们大概是整个澳洲房产行业里对人工智能最激进的采用者之一。

所以当我告诉你 ChatGPT 不能替你买房时,我不是在讲外行话。我是站在「知道它具体会在哪里崩掉」的伤疤上讲这句话。

社交媒体上流行一种很诱人的逻辑:「AI 来了,我干嘛还要付钱给买家中介?问 ChatGPT 就行。」Reddit 的帖子里、TikTok 的评论里,甚至一些本不该这么说的人嘴里,我都见过这种说法。每次读到,我心里那个精算师都会做同一道算术题,得出同一个结论。

数学不成立。我把它摆给你看。

没人给你讲的复合错误问题

哪怕 ChatGPT 每一步都有 95% 的正确率——这已经很慷慨了——买一套房至少需要十个连续决策:筛选城区、评估学区、对比近期成交、做估价、制定竞拍策略、审合同条款、查 Section 32 披露、评估建筑状况、谈价、管理交割。

0.95 的 10 次方等于 0.5987。你的整条决策链只有 59.87% 的概率全对。这比抛硬币还差。

AI 工程师给这件事起了个正式名字:compounding error effect(复合错误效应)。每个 token 1% 的错误率,在 200 个 token 上累积,整体错误率会推到 87% 1。这不是空谈。它被观察到、被测量过、被发表过。

落到现实里,Melbourne 的一家 quantity surveying 公司做过一次正经测试。他们把完整数据集和 $100 万澳元的预算交给 ChatGPT,让它推荐投资城区。超过一半的建议是错的。模型偏好公寓而不是独立屋、编造过「days on market」这类指标,有几次甚至推荐了压根不存在的城区 2。

讽刺的是?他们打开 deep research 模式,期待结果变好,结果模型对自己的错答更有信心了。不是错得更少,是「更自信地错」。

Melbourne 独立屋的中位价大约 $900,000 3。我们讲的不是周五晚上选错了餐厅。我们讲的是大多数人一生中会做出的最大一笔财务承诺。而你依赖的工具,在一整条决策链上跑出来的表现,比随机还差。

买家中介能看到、AI 根本看不到的三样东西

有三件事把人类买家中介跟目前任何一个 AI 工具区分开。我不是为保自己的饭碗才这么讲。我这么讲是因为这个差距是结构性的,不是暂时的。

第一件,是「room temperature」(现场温度)。

我不是说温度计读数。我是指你走进一场 open inspection(开放看房)时,用目光数人头的那种感觉:有多少真正在举牌的买家登记了?他们是投资者还是自住买家?是紧张的首置还是老练的选手?

来看一个 Melbourne 西区的真实例子。同一城区、同一周末、四场拍卖。第一场,底价 $850,000,最终以 $1,065,000 落槌——溢价 $215,000——因为现场有七到九个积极举牌的买家。同一天、同一走廊上的其他三场,全部流拍。没人来 4。

如果你那天问 ChatGPT 这个城区一套房值多少,它给你的是中位价。一个数字。但那个星期六下午,真实的范围是中位价上下 $215,000,完全取决于当天谁走进了那个房间。每周跑 40 到 60 场拍卖的买家中介,对现场氛围有一种数据集无法复刻的直觉。

第二件,是「动机」。

同一套房,两种卖家。一方在离婚,需要在圣诞节前拿到现金;另一方在升级住房,愿意等一个好价。面对这两种情况,谈判策略完全不同。一次离婚清算的卖家可能有 $80,000 到 $100,000 的谈判空间,升级换房的卖家可能一分都没有。

我见过溢价房在市面挂了一年,后来因为卖家情况变了,以大幅折扣私下成交。有一套 Melbourne 顶级城区的房产挂牌价 $9.5 million,一年没卖出去,十二个月后私下以 $8.5 million 成交——直接砍掉一百万 5。跟本地 network 打通的买家中介能抓住这种机会,ChatGPT 甚至不知道这套房存在。

第三件,是 off-market(内部房源)通路。

独立行业数据显示,澳洲大约 20% 的房产交易发生在 off-market,而在 Melbourne 某些挂牌量变少的走廊,这个比例可能接近 25% 到 30% 6。这些房产从不出现在 realestate.com.au 上。ChatGPT 没法分析它看不到的东西。

Melbourne 一家中介公司的研究显示,off-market 的卖家平均比公开竞价少接受 $50,000——因为没有竞价场景把情绪价往上堆 7。这 $50,000 的折让直接进了买家的口袋。但前提是买家必须能进入那个 network——而这种通路来自关系,不是算法。

没人提的数据滞后问题

多数人以为,当 CoreLogic 发布 Melbourne 房价中位数时,看到的就是当下的数据。其实不是。

Victorian Department of Treasury and Finance 发布过一份分析,显示主要房产数据公司首次月度发布时,只能捕捉到真实成交量的大约 60%。剩下的 40% 会随着交割上报滞后,在接下来的几个月里慢慢补上 8。

更糟的是,贵价房交割上报得比便宜房快。所以首次发布的中位数不只是不完整——它还会系统性地偏高。你看到的是一个过度反映高端交易、不足反映大多数投资者真正在买的那些城区的数字。

在 Melbourne 活跃的 spring 拍卖季里,活跃城区的中位价可以在几周之内波动 $50,000 到 $100,000。你用 2 月的数据去 4 月的拍卖现场举牌,不只是用了旧信息——你用的是错信息。

一个每周看 40 到 60 套房的买家中介,对价格有一种实时的「体感」,这是任何一份季度报告都赶不上的。我们知道上周六卖了什么、哪些流拍、underbidder 本来愿意出到多少。这不是数据科学,这是田野情报。当你在一套 $900,000 的资产上举牌时,它重要得很。

AI 真正配拿工资的地方

我不是反 AI。考虑到我们在自己运营里用它用得有多重,那样会很荒谬。

AI 在「脏活累活」上非常出色。初步的城区筛选——同时扫 50 个城区的人口增长、租金回报率、基础设施管线、学校排名——人类分析师两周的活,AI 几分钟搞定。

合同条款对比、翻译法律条文、从多个数据库里拉 comparable sales、在不同利率情景下建现金流模型——所有这些事上,AI 比任何人类都要快十倍。

AI 崩掉的地方,是决策链最后那 20%。那些需要物理在场、社会直觉,以及访问非公开信息的环节。关于「这位特定卖家会不会接受比叫价低 $30,000」的判断。关于「这份建筑检查报告是不是在隐瞒某些 inspector 不愿意白纸黑字写下来的东西」的直觉。

聪明的买家用 AI 处理 80% 的准备和研究,把 20%——那些真正决定你是多付 $50,000 还是少付 $50,000 的决策——交给熟悉地形的人。

这不是 AI vs. 买家中介,是 AI + 买家中介。这种组合的威力大到让人吃惊。

你看不到的过度自信陷阱

欧洲一所知名大学的研究者用 500 名参与者做过一个实验。一半人用 ChatGPT 解逻辑题。AI 辅助组得分更高——意料之中。但每一位用过 AI 的参与者,都会大幅高估自己的能力。越是熟练地使用这个工具,高估得越离谱 9。

研究者给这个现象起了个名字:cognitive offloading(认知外包)。你把思考外包出去,信心却留着,结果失去了发现错误的能力。大多数人问 ChatGPT 一个问题,接受它给出的第一个答案,然后从不去核对。

房产上的版本是这样的。有人问 ChatGPT 某个城区是不是好投资。模型返回一段听起来很像模像样的文字,引用中位价、人口增长、基础设施项目。这个人觉得自己「被武装了」。他们到拍卖现场举牌,结果多付了 $40,000,因为他们依赖的「数据」是半年前的陈货,而那些「增长驱动力」是从两年前的新闻稿里扒出来的。

他们从来没意识到自己错了,因为模型讲得太自信。这就是陷阱。

我们团队看过 Melbourne 东南走廊 350+ 宗交易。表现最好的那一批——就算在一个横盘市场里年增值也能超过 15%——在土地与建筑价值比、临近基础设施、卖家动机这些维度上有几个特定的共同特征,目前任何 AI 模型都无法评估。我们发现在资本增值上,weatherboard(木板房)始终跑赢同类的砖房,因为土地价值占比接近 100%,而买家竞争更少 10。这种洞察来自三个小时里复盘 200 个真实案例,不是来自让 ChatGPT 给某个城区做个「总结」。

一套 $900,000 的独立屋,相当于一个普通家庭三到五年的税后收入。它决定你孩子上哪所学校、你每天怎么通勤、你什么时候退休。这不是双十一买鞋,是你家未来二十年财务基石所在。

我每天都在用 AI。正因为我懂它的边界,我知道它做不到什么。尊重自己工具的边界不是软弱,而是省钱的第一步。

我是 Yan,一名从精算师转行做买家中介的人。如果精算师最懂一件事,那就是概率会复合——往两个方向都会。

为什么靠 ChatGPT 买房可能让你多花 $200,000