6月29日上午,数学与统计学院“学术立校”暨“数统天地”论坛第54、55期在志学楼331会议室举行,讲座分别邀请到了加拿大新布伦瑞克大学统计学教授马人俊和华南理工大学经济与金融学院教授贺建风为学院师生作学术讲座。
在第54期论坛中,马人俊教授通过对788名因缺血性心脏病而索赔的保险客户使用的四种不同类型的保健服务及其相应的总费用进行了为期两年的观察,发现即使对于具有相同已知个人特征的保险客户,医疗保健利用率也有很大差异。基于此发现,马人俊教授与贵州财经大学数学与统计学院段星德教授合作开展了如何描述已知个人特征无法解释的潜在风险的研究,通过联合Tweedie混合模型对这些混合型数据进行建模,而其中未观察到的潜在风险则通过随机效应进行刻画,利用最佳线性无偏预测方法预测随机效应,最总利用聚类分析方法将潜在风险的患者分为高、中、低风险组。此项研究对今后在进行资源分配时,进一步发现寻找与缺血性心脏病相关的其他个人特征提供参考,也对保险政策的制定者提供进一步参考。
在55期讲座中,贺建风教授结合当下大数据社交网络的社区特征,提出了一种聚类随机游走抽样算法,通过网络抽样算法获取样本网络实现对整体网络的推断以节约计算资源。该方法首先使用社区聚类算法将原始网络节点进行社区划分,得到多个社区网络,然后分别对每个社区进行随机游走抽样获取样本网络进行推断,最后数值模拟和案例应用的结果均表明,聚类随机游走抽样算法克服了传统网络抽样算法的缺点,能够在降低网络规模的同时较好地保留原始网络的结构特征。此外,该抽样算法还可以并行运算,有效提升抽样效率,对于大数据背景下大规模社交网络的抽样实践具有重大现实意义。
此次讲座学院师生共30人参加,学院师生通过两位教授的报告分别对应用联合Tweedie混合模型对混合型数据建模的方法、如何使用网络抽样算法获取样本网络对实现整体网络推断和节约计算资源有了更深的理解。