打通智能家居数据流动的上下游

Breaking the "data barrier lake" in smart homes

Posted by Zeusro on March 19, 2026
👈🏻 Select language

如果把一个社会人的一天的生活按照时间顺序解构,那基本流程是起床,吃饭,通勤,上班,下班,吃饭,睡觉。

数据堰塞湖

在这个过程中,可能会涉及到电脑,家用电器,汽车,手机,外卖软件等生活用品/互联网服务。

以智能家居场景为例,由于各大厂商之间的相互竞争,个人数据实际是处于各自独立的“信息孤岛状态”。比如我买了一个米家的温度传感器,但空调是海尔品牌的。因为两个品牌的数据不互通,导致无法实现“温度传感器高于36°时打开空调”这种需求;又比如我用了小米的大模型音箱,询问它当前的室温,它只能通过网络搜索,告诉我区县级别的天气温度/湿度。而这部分数据,实际上一直存在海尔空调的温度传感器中。

我把这种数据不互联互通的情况称为“数据堰塞湖”。

上下文丢失

以上午上班通勤的活动为例,“在家吃饭”和“开车去上班”发生在两个不同的场景。但从家到地下停车场的这个过程,实际上“车”是不知道的。 为了缩小问题复杂度,我们假设使用了全套的小米智能家居,以及小米汽车。理论上,通过小米手机/小米智能手环上的蓝牙信号的衰减/增强可以判断车到人的距离,进而判断是人离车,还是人开车。 然而蓝牙设备能记住的设备数量毕竟有限,只有在小范围场景才能适用这种解决方案。

上下文丢失,更多的是一种跨设备,跨系统的问题。如果说“数据堰塞湖”是一种人为的上下文丢失,那么场景的切换也会带来上下文的丢失。

举个例子,当我们走进博物馆,本质上博物馆是可以通过票证凭据和摄像头识别“知道”游客已经入馆的。但由于这套系统的运作成本过于巨大,实际操作是丢弃“数据上下文”,让游客自行游玩。

//prompt: 画一个图片,内容是人进入博物馆之后,博物馆机器人打招呼,而且游客的手机屏幕切换为一个人形的导航。使用动漫风格。

image

意念编程(Spec Coding)与主动陪伴(Active Companionship)

以上问题并非没有解决方案。

在当前的意念编程设计中,AI作为新的流量入口,用户告诉智能音箱“打开客厅的灯”,本质是表达一种期望(spec)。AI作为一种“控制器”会做好该期望的实际交付工作(找到客厅中的灯,并打开)。

但意念编程的问题在于“人主动”,而不是“物主动”。在当前版本的智能家居中,需要人为设计很多自动化场景去智能地控制电子设备(比如感应到人,并且时间在日落之后,触发自动开灯),但在我看来,AGI的第一性原理是数据保存在用户自己的消费电子终端,平台基于写时复制(copy on write),最小化地使用用户的数据。

如果基础传感器数据存在用户本地,那么自始至终就不存在“信息孤岛”的问题。而携带个人数据的消费电子终端,可以通过传感器和其他设备(车)互联。

而基于AGI之上的主动陪伴(Active Companionship),则是智能家居自动化控制流/家居机器人的关键。以午睡这个场景为例,实际上,通过累计足够的数据(用户在工作日12点之后通常会拉窗帘,并关灯),建立相关的关联关系,智能家居应该是可以直接给用户提出一个建议(工作日中午时段当感知到你之后,我会关灯并拉窗帘),并在获取用户授权后,工作日自动化执行。

If we deconstruct a social person’s daily life in chronological order, the basic flow is: wake up, eat, commute, work, get off work, eat, sleep.

Data Barrier Lake

In this process, various consumer goods and internet services may be involved—computers, home appliances, cars, phones, food delivery apps, and so on.

Take the smart home scenario as an example. Due to competition among major manufacturers, personal data is effectively trapped in isolated “information silos.” For instance, I bought a Mijia temperature sensor, but the air conditioner is a Haier brand. Because the two brands’ data don’t interoperate, I can’t implement a rule like “turn on the AC when the temperature sensor reads above 36°.” Or consider Xiaomi’s LLM-powered speaker: when I ask it about the current room temperature, it can only answer via web search, giving me district-level weather temperature/humidity—even though that data actually exists in the Haier AC’s temperature sensor all along.

I call this situation where data fails to interconnect “data barrier lake.”

Context Loss

Take the morning commute as an example. “Eating at home” and “driving to work” happen in two different contexts. But the car has no knowledge of the transition from home to the underground parking lot. To reduce complexity, assume we use a full Xiaomi smart home setup plus a Xiaomi car. Theoretically, Bluetooth signal attenuation/strengthening from a Xiaomi phone or smart band could indicate the distance between car and person, and thus whether the person is leaving or approaching the car. However, Bluetooth devices have a limited number of devices they can remember, so this approach only works in small-scale scenarios.

Context loss is largely a cross-device, cross-system issue. If “data barrier lake” is a man-made form of context loss, then context switching also causes context loss.

For example, when we enter a museum, the museum could in principle “know” that a visitor has entered via ticket credentials and cameras. But because the cost of running such a system is prohibitively high, the practical approach is to discard “data context” and let visitors explore on their own.

//prompt: Draw an image of a person entering a museum, a museum robot greeting them, and the visitor’s phone screen switching to a humanoid navigation interface. Use anime style.

image

Spec Coding and Active Companionship

These problems are not without solutions.

In current Spec Coding design, AI acts as a new traffic entry point. When a user tells a smart speaker “turn on the living room light,” they are expressing an expectation (spec). The AI, as a “controller,” handles the actual delivery of that expectation (finding the living room light and turning it on).

But the issue with Spec Coding is that it is “human-initiated” rather than “thing-initiated.” In current smart home setups, many automation scenarios must be manually designed to control devices (e.g., sense a person and, if it’s after sunset, trigger automatic lighting). In my view, the first principle of AGI is that data is stored on the user’s own consumer electronics, with platforms using copy-on-write to minimize use of user data.

If base sensor data resides locally on the user’s device, there is no “information silo” problem from the start. Consumer electronics carrying personal data can interconnect with other devices (e.g., the car) via sensors.

Active Companionship built on AGI is key to smart home automation flows and home robots. Take the afternoon nap scenario: with enough accumulated data (e.g., the user usually draws the curtains and turns off the lights after 12:00 on weekdays), correlations can be established. The smart home should be able to propose a suggestion (“On weekday afternoons, when I sense you, I’ll turn off the lights and draw the curtains”) and, after user authorization, automate it on weekdays.

Если деконструировать день социального человека в хронологическом порядке, базовая последовательность такова: пробуждение, еда, поездка на работу, работа, возвращение, еда, сон.

Озеро данных (Data Barrier Lake)

В этом процессе могут участвовать компьютеры, бытовая техника, автомобили, телефоны, приложения доставки еды и другие потребительские товары и интернет-сервисы.

Возьмём сценарий умного дома. Из-за конкуренции между крупными производителями персональные данные фактически оказываются в изолированных «информационных островах». Например, я купил температурный датчик Mijia, а кондиционер — Haier. Поскольку данные двух брендов не обмениваются, невозможно реализовать правило «включить кондиционер, когда датчик показывает выше 36°». Или: я использую колонку Xiaomi с большой языковой моделью и спрашиваю текущую температуру в комнате — она может ответить только через веб-поиск, сообщая температуру/влажность на уровне района. Хотя эти данные всё время есть в температурном датчике кондиционера Haier.

Я называю такую ситуацию, когда данные не связаны между собой, «озером данных» (data barrier lake).

Потеря контекста

Возьмём утреннюю поездку на работу. «Еда дома» и «поездка на работу» происходят в двух разных контекстах. Но машина не знает о переходе от дома до подземной парковки. Чтобы упростить задачу, допустим, используется полный комплект умного дома Xiaomi и автомобиль Xiaomi. Теоретически по затуханию/усилению Bluetooth-сигнала с телефона или умного браслета Xiaomi можно определить расстояние между машиной и человеком и понять, человек уходит от машины или подходит к ней. Однако Bluetooth-устройства могут запомнить ограниченное число устройств, поэтому такой подход применим только в малых масштабах.

Потеря контекста — это в основном проблема между устройствами и системами. Если «озеро данных» — это искусственная потеря контекста, то смена сценария тоже приводит к потере контекста.

Например, когда мы входим в музей, музей в принципе может «знать» о приходе посетителя по билету и камерам. Но из-за чрезмерно высоких затрат на такую систему на практике от «контекста данных» отказываются и дают посетителям свободно осматривать экспозицию.

//prompt: Нарисуй изображение: человек входит в музей, робот музея приветствует его, экран телефона посетителя переключается на человекоподобную навигацию. В стиле аниме.

image

Spec Coding и Active Companionship

У этих проблем есть решения.

В текущей концепции Spec Coding ИИ выступает новой точкой входа. Когда пользователь говорит умной колонке «включи свет в гостиной», он выражает ожидание (spec). ИИ как «контроллер» выполняет это ожидание (находит свет в гостиной и включает его).

Но проблема Spec Coding в том, что инициатива исходит от «человека», а не от «вещи». В нынешних умных домах приходится вручную проектировать множество сценариев автоматизации (например, обнаружить человека и, если уже после заката, включить свет). По моему мнению, первый принцип AGI — данные хранятся на собственных устройствах пользователя, а платформы используют copy-on-write, минимизируя использование пользовательских данных.

Если базовые данные сенсоров хранятся локально у пользователя, проблемы «информационных островов» изначально не возникает. Устройства с персональными данными могут связываться с другими устройствами (например, машиной) через сенсоры.

Active Companionship, построенный на AGI, — ключ к потокам автоматизации умного дома и домашним роботам. Возьмём сценарий дневного сна: накопив достаточно данных (пользователь обычно закрывает шторы и выключает свет после 12:00 в будни), можно выявить корреляции. Умный дом должен уметь предложить: «В будние дни в обеденное время, когда я почувствую тебя, выключу свет и закрою шторы» — и после одобрения пользователя автоматически выполнять это по будням.



💬 讨论 / Discussion

对这篇文章有想法?欢迎在 GitHub 上发起讨论。
Have thoughts on this post? Start a discussion on GitHub.

在 GitHub 参与讨论 / Discuss on GitHub