硕士生魏嘉泽Scientific Data: 中国100户家庭空气净化器一年的时均空气质量参数数据集

2023年10月18日,《Scientific Data》杂志(IF:9.8)刊登了课题组魏嘉泽硕士生的论文:One-year dataset of hourly air quality parameters from 100 air purifiers used in China residential buildings (https://doi.org/10.1038/s41597-023-02640-y


背景介绍

家用空气净化器作为改善室内空气质量的有效手段现已被广泛使用。空气净化器可以自动记录室内空气质量参数,为未来的数据分析提供了宝贵的数据资源。这项工作展示了家用空气净化器在中国4个不同气候区18个省份100个居民家庭中收集的一年室内空气质量每小时的数据集。数据收集时间为2021年7月1日至2022年7月1日。每小时记录一次空气净化器运行时的甲醛、PM2.5、TVOC浓度、温度、相对湿度、净化器开关状态以及风量。该数据集提供了住宅建筑室内空气质量的全面而详细的信息,有助于评估空气净化器的净化效果、室外气候变化对室内空气质量的影响以及预测未来室内人行为。

图1. 中国4个不同气候区18个省份的空气净化器位置分布图

【核心内容】

(1) 原始数据处理方法

原始数据的处理过程如图2所示。初始数据筛选的阈值定为 7%,缺失率超过7%的数据都将从原始数据集中剔除,保留的数据成为为初始数据集的一部分。初始数据建立后,填补其中存在的缺失值。之后,实施数据清理方法,删除和估算数据异常值。重复这一迭代过程,直到数据集不包含任何缺失值。

图2. 数据处理过程流程图

(2) 数据集可用性分析

图3显示了安装在陕西省的一台特定空气净化器的所有处理参数在一天内的变化情况。可以看到温度和湿度随时间有规律地波动,而空气污染物的峰值通常出现在上午9:00和晚上 9:00左右,空气净化器的档位也会根据污染物浓度的变化进行相应调整。中午前后,污染物浓度通常会降至较低值,从而导致净化器自动关闭。也因此夜间污染物浓度峰值会高于白天。

图3. 一天内空气净化器所有监测参数的变化

图4显示了安装在陕西省的同一设备在2天内的参数变化与开/关状态的关系。采样时间设定为一小时,空气净化器设定为自动调节模式,记录每小时内污染物的平均浓度以及空气净化器的相应状态。可以看出,当污染物浓度超过阈值时,空气净化器会自动开启,直至污染物达到正常浓度,对室内污染物有较好的控制能力。

图4. 室内空气质量参数与两天内的净化器开/关状态的关系

成果小结

该数据集提供了住宅建筑室内空气质量的全面而详细的信息,可用于评估空气净化器的净化效果、室外气候变化对室内空气质量的影响以及人类室内行为的未来趋势。结合数据集对室内空气污染物的净化效果进行研究,体现了净化器对室内空气环境的控制效果,评估其在改善居民室内空气质量方面的综合表现,该数据集具有较好的未来研究价值。

【作者介绍】

该论文的第1作者是清华大学建筑技术科学系硕士生魏嘉泽,通讯作者为深圳大学土木与交通工程学院特聘教授莫金汉和深圳大学土木与交通工程学院副教授范成。清华大学建筑技术科学系博士生汪琰参与了这项工作。


本文引用格式

Wei, J., Wang, Y., Mo, J., Fan, C., One-year dataset of hourly air quality parameters from 100 air purifiers used in China residential buildings. Scientific Data, 2023, 10(1): 715.

该工作受到国家自然科学基金(项目号:52078269和52325801)资助,特此致谢。

原文出处:https://doi.org/10.1038/s41597-023-02640-y


相关阅读