研究方向
(1)多模态非结构化数据处理基础理论:
大数据问题的出现是信息产业发展的必然。传统的信息科学研究缺少针对大规模数据的基础理论研究,现有的数据解决方案多是基于传统的系统方案拼凑而成。但是,这样的研究方式不能够持续性地解决数据科学的基础问题。系统性地对基础理论的研究可以让我们从本质上了解数据,这是解决未来大数据问题的关键。针对这一方面,实验室将面向新一代智能信息系统与智慧医疗,以基于多模态、非结构化的数据科学为主要目标进行深入研究,具体研究目标包括:针对类型丰富、结构复杂的多模态数据,研究数据表征提取、数据因果关系分析、数据统计建模、与数据安全和隐私等关键基础理论,构建完备数据科学基础理论体系。
(2)大规模数据分析核心算法:
互联网时代下用户急剧增长,海量数据汹涌袭来,数据量将超过存储和处理器的承载上限,加上对数据安全与隐私的需求,新型的数据计算方法需要在分散的数据存储环境下进行。在计算资源以及通信带宽限制下,传统的数据计算方法已无法满足针对新一代智能信息系统与智慧医疗的高效计算需求。针对这些问题,主要研究内容包括:面向新一代通信网络大规模网络优化问题、分布式存储的医疗大数据分析问题等,提出大规模异步分布式并行分析与计算技术、强化学习算法与大规模高效求解器,以在资源受限的动态数据网络下,实现高效处理具有海量规模、非结构化、异构源、不均匀分布、安全与隐私保护性等特质的大数据核心算法。
(3)数据科学核心应用平台:
以与华为共建的未来网络系统优化创新实验室为基础,围绕数据驱动的大规模智能信息处理、大规模智能网络优化,建设网络系统优化创新平台。以国家卫健委批准建设的国家健康医疗大数据研究院(深圳)为基础,围绕可视计算以及智能自然语言理解,建设健康医疗大数据研发平台。通过集成与共享大规模数据集、海量数据计算方法研究,建设面向智能信息系统和智慧医疗等重点应用方向数据科学理论与应用的国际领先创新平台,解决广东省与国家数据科学发展和应用的关键问题,取得世界一流的标志性原创成果,助推相关领域技术转化和产业发展,为数据强国建设、粤港澳大湾区和深圳先行示范区的建设做出贡献。