基于城市大数据的高斯贝叶斯模型识别空气污染的时空因果关系

基于城市大数据的高斯贝叶斯模型识别空气污染的时空因果关系
李安国教授
2022年10月5日
研究

识别空气污染物的因果关系,并回答诸如北京的空气污染物来自何处等问题,对政府决策至关重要。在本文中,我们通过挖掘城市大数据来确定不同地点的空气污染物的时空因果关系。这具有挑战性,原因有二。1)由于空气污染物可以在本地产生,也可以从附近分散开来,我们需要从许多候选地点中发现ST空间中的原因,并提高时间效率;2)空气污染物之间的因果关系会受到气象等混杂变量的进一步影响。为了解决这些问题,我们提出了一个由两部分组成的高斯贝叶斯耦合模型。1)高斯贝叶斯网络(GBN)来表示空气污染物之间的因果关系,用基于熵的算法在ST空间中有效地定位原因;2)将因果关系与气象学相结合的耦合模型,在消除混杂影响的同时更好地学习参数。使用2013年6月1日至2015年5月1日期间52个城市的空气质量和气象数据对所提出的模型进行了验证。结果表明,我们的模型在时间效率和预测精度方面都优于基线因果关系学习方法。

基于城市大数据的高斯贝叶斯模型识别空气污染的时空因果关系

麻省理工学院学士丶硕士丶博士;香港大学电子工程系首席教授;清华大学长江学者;IEEE院士,香港工程科学院院士;香港特别行政区铜紫荆勋章获得者。