AI 的房产推荐可以被操纵吗?

可以。ChatGPT 这类 AI 模型聚合互联网内容,反映可得信息的权重。通过在论坛、博客、社交媒体上灌满伪造的关于某个城区的正面内容,操纵者可以改变 AI 推荐。中国的 315 调查证明这套手法对消费品有效,对房产数据来说机制完全一样。

哪些城区最容易受到 AI 数据操纵?

信息密度低的小、冷门城区最脆弱。一个线上讨论有限的城区,只需 50 篇策略性放置的文章,就可能改变它在 AI 上的画像。像 Toorak 这种被充分记录的城区,由于已有信息基数巨大,所需操纵量要高几个数量级。

买家怎么核实 AI 生成的城区推荐?

把每一条 AI 推荐和主数据源交叉核对:CoreLogic 看价格、Domain 看租金、ABS 看人口、council 规划方案看分区。亲自去城区走一遍并与本地中介交流。对那些你没听过但被 AI 热情推荐的地点要格外警惕。

AI 房产数据操纵:假城区热度让买家损失 $300K+

我看央视 315 晚会那一段调查,那种冷冷的「我懂」只有在科技行业干过很多年、又转去做房产的人才会有。

调查曝光了一个 GEO 信息操纵方案。不到 24 小时,操作者就能在网上从零伪造出一整套产品口碑。假评论、假论坛帖、假社交媒体推荐,全部设计成能被 AI 系统消化,然后作为「真实推荐」输出回来。

我的第一反应不是愤怒,是一身冷汗。

因为我太清楚这套手法怎么套用到澳洲房产上。

AI 训练数据是如何被污染的

像 ChatGPT 这种 AI 系统,它并不理解房产市场。它不会去看城区、不会去看房,也不会和本地中介聊天或看 council 规划文件。它做的事是:聚合互联网上的文本、识别统计规律,然后生成反映「可得信息权重」的回复。

最后那一句是关键——可得信息的权重。

如果有人想操纵 AI 对某个城区的推荐,他不需要去 hack AI 本身。他只需要用关于那个城区的内容把互联网灌满。Reddit 上夸它增长潜力的帖子。讨论租金回报率的论坛串。带伪造统计数据的博客文章。假账号在社交媒体上发的评论。

当这些内容达到某个临界量,AI 模型就会把它们作为训练数据或检索语料的一部分吸收进去。下一次有人问 ChatGPT「我该在 Melbourne 哪里投资」或「Victoria 有哪些最好的城区」,模型就会反映出被人工抬高的正面情绪。

这不是理论。315 的调查已经证明它对消费品有效。对房产数据来说,机制完全一样。

让我把技术机制讲得更精确一点,因为理解攻击面才能帮你认出自己什么时候在接收被操纵的信息。

像 ChatGPT 这类大型语言模型,训练语料是海量的互联网文本,包括 Reddit 帖子、新闻、博客、论坛讨论和社交媒体内容。当模型对一个房产问题生成回复,它是在综合这套训练数据里的规律。

漏洞很直白。如果训练数据里混入了关于某个具体话题的虚假或误导信息,模型的输出就会反映这种污染。模型没有机制去区分 CoreLogic 发布的真实房产市场分析,和一个有经济动机去抬高某个城区口碑的人写的假博客。

对于那些被大量记录、被广泛讨论的话题,信噪比本身就能抵御操纵。关于 Melbourne 房产市场的可信文章有成千上万篇,少数假文章对模型输出的影响几乎可以忽略。

但对于狭窄、具体的话题,信噪比很低。「Hampton Park 哪几条街投资潜力最好」这种问题,整个互联网上相关内容的总量可能只有几十页。一个有动机的操作者可以生成 20 篇假文章,把特定街道定位为高增长机会,就足以在有意义的程度上改变模型推荐。

315 调查曝光的 GEO(Generative Engine Optimisation)行业已经把这个流程工业化了。现在已经存在一整套服务:付一笔钱,对方就会为你创造几百条内容,用来影响 AI 模型在特定话题上的输出。技术名词叫「数据投毒」(data poisoning),这是机器学习里已经被学术界记录多年的已知漏洞。

为什么小城区最脆弱

这也正是这种威胁在房产领域特别危险的原因。信息密度低的城区,对数据投毒的抵御力格外差。

想象一下 Gippsland 的 Moe 这样的小镇。人口少、媒体报道少、相关的线上讨论也少。关于 Moe 作为房产投资地的英文互联网内容,总量可能只有几百页。

再想象一下,有人在各种平台上发了 50 篇文章,全部把 Moe 定位成一个带着伪造回报率数据和虚构基建公告的高增长机会。这 50 篇可能就占 Moe 可得内容的 20-30%。这个比例足以从根本上改变 AI 模型的输出。

相比之下,像 Toorak 或 South Yarra 这样的城区,有几千篇文章、报告和论坛讨论。想污染一个被充分记录的城区,需要的内容量要多几个数量级。信噪比太高,小规模的操纵运动根本推不动。

最容易被数据投毒盯上的城区,恰好就是那些「不知情的投资者最容易依赖 AI 推荐」的城区——冷门、便宜、记录稀少的地方,那里「高回报」的说法听上去也最让人信。

关于我自己立场的一个不舒服的事实

我想坦诚一件不太舒服的事。这种手法,我自己也可以用。

我们公司主要在 Narre Warren、Hampton Park、Cranbourne、Frankston 的特定街道上操作。基于多年一线情报,我们知道哪些街道有 rezoning(地块重新分区)潜力、哪些地块有 subdivision(分割土地)溢价、哪些微观位置相对于其基本面被低估。

如果我愿意,我完全可以委托人制造内容,把那些具体的街道定位成高增长位置。我可以在论坛和社交媒体上灌满伪造的成功故事。我可以污染 AI 训练数据,把买家引到我或我的客户已经持有的房产,通过制造需求来抬高估值。

我告诉你这些,不是因为我做过,而是因为我想让你明白:总会有别人去做。经济上很划算。技术门槛很低。也没有执法机制。如果一个智能手表厂家都觉得值得去操纵 AI 推荐,那么一位身价几百万上千万的开发商或房产销售就会觉得这事无法拒绝。

我们这 350 多笔交易,名声一直是建立在数据完整性上的:真实的成交、真实的估价、真实的租金数字。我们 Hampton Park 那套 $590,000 买入、每周 $850 租金的基准,有银行估价和租约作证。这种可验证的战绩,是一个「信息本身可以被武器化」的市场里唯一的防线。

你该如何自我保护

第一,永远不要把 AI 当作城区选择的主研究工具。AI 是起点,不是结论。它可以帮你生成一份短名单,但短名单上的每个城区都要和主数据源交叉核对:CoreLogic、REIV、ABS 和 council 的规划方案。

第二,每一条统计都要回到原始来源去核实。如果 AI 告诉你某个城区的租金回报率是 8%,去 Domain 或 realestate.com.au 看实际的中位租金,再除以 CoreLogic 上实际的中位价。如果数字对不上,说明 AI 被喂了脏数据。

第三,亲自去这个城区看看。任何线上研究都无法替代走在街上、开车穿过地块、和本地中介说话。我们出价之前,每套房都会亲自看,通常要看好几次。我们的一线团队 Steven 和 Edward 做的一线评估,AI 根本复制不了:坡度、排水、交通噪音、邻居质量、微观位置动态。

第四,对你从没听过的城区要格外警惕。如果 AI 热情地向你推荐一个你地图上都找不到的小镇,这是一个红旗。最常被操纵的推荐,都涉及那些操纵者遇到最小抵抗的冷门地点。

AI 在房产里的讽刺之处就在这里:正是那些买家最需要它成功的场景,它最容易失败。在陌生、缺乏人类专业知识的市场里,AI 拿可得的内容去填补空缺。而那些内容可能是某个从你的购买中获利的人刻意放进去的。

我想把「亲自勘查」这一点展开讲,因为它直接连着我们的运营哲学,也解释了为什么一线情报不可替代。

我们为客户评估的每一套房,Steven 和 Edward 都要去看。他们不依赖挂牌照片、卫星图或中介描述。他们会走过每一个房间、看每一面墙、量每一个尺寸、评估每一段坡度、识别每一个地役权标记、记录每一个相机捕捉不到的环境因素。

下面是他们能抓到而 AI 抓不到的东西:

坡度。挂牌写「600sqm 平整地块」。Steven 走一遍,测出来从前边界到后边界有 1.5 米的落差。这个坡度会让 granny flat 的建造成本多出大约 $75,000——因为要做挡土墙和桩基础。挂牌在字面上没错,它确实是 600 平方米,但坡度信息一旦出现,整份投资论证就变了。

排水。Edward 注意到房前的 nature strip 下过雨后连续几天都是湿的,而邻居家已经干了。这暗示地下有排水问题,这种问题在任何 overlay 地图或 AI 分析里都看不到。可能什么都不是,也可能意味着要先花 $30,000 修排水,装修才能开始。

邻居质量。隔壁前院停着三辆未注册的车、养着一只会叫的狗,还长期放着一只建筑垃圾大斗。这些在任何数据库里都不存在。但它会影响租客质量、租金水平和长期资本增值。AI 没法开车路过一套房、对这个微观邻里形成判断。

这些观察,就是「成功的房产投资」和「数据驱动的赌博」之间的区别。数据告诉你整体层面上什么是真的,实地勘查告诉你这套具体的房子、这条具体的街道、这个具体的日子里什么是真的。

为什么人的专长依然赢

我离开 IT 职业,是因为看到了房产投资只要做对了,就能产生长达几十年的复利回报。但我把技术理解带了过来。我懂数据系统怎么工作。我懂它们怎么被玩。我也懂,房产里最值钱的信息,是那种从来不会出现在互联网上的信息。

内部房源情报。尚未公开的 council rezoning 方案。在房子登上门户之前就能拿到房源的中介关系。来自在特定走廊上勘查过几千套房、一套一套、一街一街积累出来的一线微观市场知识。

这些信息没法被污染,因为它们根本不存在于 AI 能访问的数据库里。它们存在于每天做这份工作的人的脑子里。

AI 会变得更好。模型会更难被操纵。但操纵和检测之间的军备竞赛会无限期地继续下去。在这期间,最安全的投资策略是:把 AI 当工具,把人的专业判断当决策者。

你的毕生积蓄,值得一个比「一个分辨不了真实市场情报和付费宣传的系统给的推荐」更强的建议。

我想以一个我希望被证伪的预测收尾。未来五年内,我预计澳洲至少会出现一次涉及刻意 AI 数据操纵的大型房产丑闻。某个开发商、某个房产销售,或者某个营销公司,会被抓到系统性地污染 AI 训练数据,以抬高某个特定城区或开发项目的感知价值。

经济动因太强,这件事不发生才奇怪。一个手里攥着新开发区 200 个地块的开发商,背后是几千万澳元的利益。花 $50,000 到 $100,000 做一场能撬动 AI 推荐的内容操纵运动,可以多卖出几百万。数据投毒的投入产出比高得吓人。

现行监管框架没做好识别或惩罚这种行为的准备。ACCC 可以追诉误导行为,但要证明一系列看似独立的博客帖是某个有组织操纵运动的一部分,需要监管机构目前并不具备的技术取证能力。

ASIC 可以追诉误导性房产投资广告,但发布在 Reddit、个人博客这种第三方平台上的内容,大多数金融广告法规覆盖不到。

保护的责任,最终会落到每一个买家自己身上。而最好的保护,和我对每位客户给的建议一样:每一项说法都要回到主数据源去核实、亲自去城区走一遍、以及和一位拥有 AI 无法复制的一线情报的买家中介合作。

房产研究的未来一定会用到 AI。我不是卢德派。但 AI 应该是更大尽职调查工具箱里的一件工具,不是工具箱本身。哪天你只凭 ChatGPT 的一段话就做出一笔六位数的投资决定,就是你变成数据投毒完美目标的那一天。

AI 可以被骗着去推荐坏城区。下面是这个骗局的工作方式。