网络数据科学与技术重点实验室

研究方向与内容

  中科院网络数据科学与技术重点实验室立足于国家网络空间战略性任务和大数据产业发展需求,对适应网络数据内在规律的复杂性与数据计算理论、网络空间的态势感知与数据表示、大数据挖掘与社会计算、大数据分析引擎和大数据平台系统等方向进行研究,具体研究方向和主要研究内容如下:

  1.网络数据复杂性与数据计算理论

  针对网络数据呈现出的异构多态、动态涌现、复杂关联等特点,对网络数据的规律、网络数据的复杂性理论和网络数据的计算理论等进行研究。具体研究领域包括:探索网络数据的聚集特性和传播规律,研究网络数据的结构与功能稳定性机理及深层规律;研究非确定化、局部增量的学习理论,预测数据演变的全局趋势和涌现规律,提出网络数据的新型算法理论基础;探索弱CAP约束的系统架构模型及其代数计算理论,研究分布化、流式计算算法和复杂性度量理论和大数据分布式计算体系架构等。

  2.网络空间感知与数据表示

  针对网络空间中数据具有跨媒体关联、强时效演变、多主体互动等特点,对无边界分布的网络数据及其状态的有效感知和探测进行研究,对多源异构数据进行质量评估采样,对多源富特征数据之间的相关性、差异性和显著性进行度量,最终实现对多源、异质、富特征数据的统一表征。具体研究领域包括:研究网络空间数据态势的感知与测量;研究网络数据的质量评估与、采样与获取方法;研究多源、异质数据的清洗、提炼与融合表示等。

  3.网络数据挖掘和社会化计算

  针对大规模网络数据进行挖掘分析,对社会网络运行的规律与发展趋势进行研究,具体研究领域包括:研究大规模用户数据的测量与挖掘方法,数据间内在的多维度异质关联关系,探索异质关系数据的关联度量和融合分析方法;研究大规模数据分析中的高效排序模型和框架和面向大数据的机器学习模型与方法;研究基于用户产生数据和用户交互行为的信息推荐方法;研究社会网络中稳定的统计规律,分析网络演化规律并预测网络演化;研究社会媒体中信息交互和信息传播与扩散的内在模式,分析和预测信息传播中的突发现象和话题演化的宏观态势等。

  4.大数据分析引擎相关技术

  面向海量数据进行高效计算和分析的能力是决定大数据价值落地的关键,具体研究领域包括:大数据基础分析算法:利用表达学习与增强学习,提升分类、聚类、查询、检索、匹配、关联分析、回归分析等基础算法的精准性和适用性;研究大数据融合分析技术:利用认知计算与深度学习,提升异构表达、跨媒体抽取与内容理解、异构数据融合分析、异常模式识别等高级算法的效能;研究大数据预测决策与可视化:利用机器学习与知识建模,突破大数据预测、知识推演、可视化分析、辅助决策等大数据分析技术;研制智能分析硬件与弹性流式分析引擎,提高复杂大数据分析的时效性和规模可扩展性;利用智能分析芯片和硬件重构技术,跨越式提升复杂大数据分析计算的速度;研制弹性泛流式分析引擎,支持批式、流式和在线分析;研制全链路大数据分析软件栈和分层开放编程语言,提升大数据分析技术的易用性和工程化能力。