实验室简介

        山东大学系统安全与隐私保护实验室(SPLab: System security and Privacy protection Laboratory)隶属于山东大学计算机科学与技术学院,专注于大数据环境下的系统安全与隐私保护基础理论和关键技术研究,以及在社会计算、协同计算和移动计算等领域中的应用。实验室的主要研究方向包括用户网络行为分析与隐私保护、数据库系统操作审计、移动应用行为分析和隐私保护、基于网络数据的知识发现与推荐等。近年来,实验室先后承担和参与了国家自然科学基金、国家863项目、国家科技支撑计划、山东省重大科技发展项目、山东省自然科学基金等十余项国家和省部级项目。在身份识别、敏感属性推断、异常检测、共谋分析、用户行为预测和个性化推荐等问题上取得良好的科研成果,在电子商务企业信誉管理、基于金融大数据的贷后风险分析、电子商务欺诈分析和能源零售行业大数据分析方面有成功应用。

        实验室负责人孙宇清博士,现为山东大学计算机科学与技术学院教授,中国计算机学会协同计算专业委员会副主任,系统软件专业委员会委员,山东省电子政务专家咨询委员会成员。研究方向为协同计算与数据隐私,在国内外期刊和国际会议上发表科研论文60余篇。作为会议主席、程序委员会委员和审稿人服务于IEEE Transaction on Dependable and Secure Computing,International Journal of Computers and Applications,Springer Information Systems Frontiers,软件学报,计算机学报,通讯学报,电子学报,SCC,EDOC,UIC等二十余个国内外学术期刊和学术会议。

        地址:山东大学软件园校区 科研楼 222

研究方向

基于社会化大数据的用户网络行为分析

随着移动通讯技术的高速发展与智能终端的普及,移动应用逐渐渗透并深刻影响着人们的生活和工作。这些活动产生了大量的用户生成数据和痕迹数据,从不同层面反映了人们的政治观点、心理活动、个性偏好和交友情况等。深度挖掘用户网络行为,并借助辅助信息和公共知识库,不仅可以推断用户的属性信息、价值倾向、喜爱偏好和隐含因素等,还能从网络行为中挖掘不同用户特有的行为模式,结合用户的属性信息和内在特征对用户进行多维画像,生成具有语义的可解释描述,进而进行身份识别和行为预测。从用户的行为数据中还可以分析用户之间的关系,进行社团分析以及关系预测,结合用户画像进行跨平台的身份映射。

敏感属性推断、人口统计信息分析和用户画像

个体属性信息是指年龄、性别、教育程度等敏感信息,这些信息与个体价值倾向密切相关,可以帮助发现个体价值分布规律.群体属性分布或称人口统计信息是指不同属性的用户在群体中的比例分布情况,分析这些信息具有重要的现实意义,能够辅助分析社会化价值的分配原理和方法,帮助市场购物篮分析、调整营销学马歇尔策略、提供个性化推荐等.不仅如此,获得用户属性信息还可以帮助识别个体身份.但是, 大多数用户都不愿意将这种敏感数据暴露给公众,使得这些信息通常不容易获得,因此需要基于用户行为进行推断.本方向研究针对用户的属性信息和行为模式,结合环境信息和客体信息,从时间序列、行为模式、价值倾向、心里特征等方面对用户进行画像,发现用户行为模式的周期规律,推断客户属性、预测用户行为。用户画像有助于理解用户的网络行为,根据用户画像建立的用户数据库可用于特征匹配、身份识别等问题,用户画像还可以帮助进行跨平台的身份映射。

用户关系分析和社团划分

用户关系分析关注个体之间的社会关联关系、个体社会角色和个体影响力,是个体价值发现的重要方面,对于好友推荐、个性化推荐、商业合作等问题都具有实用价值.关系预测是针对社会网络中的两个用户,分析将来可能产生社会关联的概率,或是针对已经建立关系的两个用户,分析其社会关系类型和亲密程度.为了更好地将多模态用户行为数据与用户交友意图联系起来,我们尝试引入潜在因素量化行为的内在影响因素;针对用户的个性化交友偏好,提出了基于比例和信息熵的属性重要度计算方法和基于属性的用户关系度量方法。结合社交网络拓扑关系、属性及行为等多模态数据,提出了独立融合和相互依赖融合两种方法融合各种度量。分析多用户构成的社团关系能够发现用户共性,帮助用户画像,还能应用于推荐系统中的协同过滤,以及共谋恶意行为检测等工作。

身份识别和跨平台身份映射

个体身份识别是指识别网络用户的现实身份或是发现多网络平台间的身份映射关系, 具有重要现实意义,如帮助分析不同层面的个体价值和行为模式;用户在不同平台之间进行迁移的时候,可以保持有用信息的连续性;借助多个平台间的用户身份交叉检查有助于提高用户信息的一致性,用于审核用户信用作为贷款的参考信息,防止遗漏信息和防范欺骗等. 我们针对用户网络行为,提出了面向复杂网络对象的特征抽取方法,详细分析了不同类型的行为对于虚假账户的识别能力,使用组合特征和增强学习有效提升了识别的效果,并在真实数据集上进行了验证。虚假账户的识别技术能够应用于电子商务、影评等网站的欺诈行为发现,也可应用于社交媒体中的用户画像。而跨平台的用户身份映射问题,能够完善用户属性信息,进而更完整地画像用户。

移动计算与隐私保护

随着移动智能终端普及和定位技术的发展,用户隐私威胁这一问题越来愈引起人们关注,如用户通讯录、短信、通话记录等私有数据,用户Wifi网络访问、GPS定位、照相等功能均可能被移动应用滥用;另外,基于位置服务的产生和发展,使得位置服务提供商也保留了大量的个人数据,给用户带来隐私威胁。针对这些问题,本方向主要研究移动计算环境中的隐私保护技术和方法,面向用户智能终端的各种隐私数据和位置服务中的用户隐私,如用户身份隐私、位置隐私和基于位置服务中的内容隐私等,借助群智协同等技术,提出相应的隐私保护方法,帮助用户了解隐私泄露状况,进行必要保护。