基于wifi的行为轨迹数据挖掘分享

演讲稿(图文版)

移动对象轨迹数据挖掘方法研究综述(文字版)

系统框架

  • (1)数据层。用来收集相关移动对象的轨迹数据并存储在相应数据库中,工作包括移动对象轨迹数据的采集、清洗以及不同轨迹数据的集成。
  • (2)逻辑层。以移动对象轨迹数据为基础进行移动对象活动规律的挖掘,并对挖掘结果进行深入的分析。逻辑层上针对对象的轨迹数据可以分为四个层:微观层次的数据挖掘、宏观层次的数据挖掘、模式发现相关的数据挖掘、知识发现相关的数据挖掘。
  • (3)用户层。用户层主要包括用户的输入交互以及移动对象的数据挖掘的结果可视化展示两方面功能。展示主要包括:轨迹再现,挖掘结果的展示,相关数据的统计图表展示等。

方法层次

(1)微观层次的数据挖掘,主要在移动对象轨迹数据内部,从采样点及采样时间的分布上来研究移动对象的活动特征。其包括轨迹的聚类分析、轨迹的分类分析、轨迹的异常检测分析、轨迹的异常检测分析、轨迹的索引建立。

(2)宏观层次的数据挖掘,通过利用微观分析的结果,或者微观层次分析的相关方法对移动对象的宏观活动进行发现,发现对象较为有意义的活动。其包括:对象的STPM 发现、兴趣区域发现、运动特征分析、对象的活动发现。

(3)模式发现相关的数据挖掘,主要在移动对象微观和宏观分析的基础上,研究对象活动的时间和空间特点来发现对象的活动规律,从庞杂琐碎的移动对象轨迹数据中分析出对象的活动规律和行为模式。

(4)知识发现相关的数据挖掘,整合已知的挖掘成果或先验知识并以此为基础进行高层次的知识发现,主要包括:移动对象活动的预测、移动对象时空知识推理、移动对象时空知识推理。

系统结构

(1)数据预处理模块。对轨迹数据进行清洗和降噪等处理,增强移动对象轨迹挖掘相关方法的运行效率,主要包括:轨迹数据的清洗,轨迹数据的降噪以及轨迹识别等操作。

(2)轨迹数据的微观分析模块。从轨迹数据本身出发,研究移动对象的运动特点,通过轨迹数据的异常检测与轨迹的聚类来描述该模块在微观分析中的功能。

(3)轨迹数据的宏观分析模块。通过移动对象的兴趣活动发现、对象的兴趣路径发现两个方面的应用,对该模块的宏观轨迹数据分析过程进行描述。

(4)轨迹数据的模式发现模块。过移动对象的多粒度兴趣活动发现、对象活动的多粒度周期模式发现两个方面来对移动对象活动的模式进行发现和分析。

(5)轨迹数据的可视化分析模块。以轨迹数据的分析结果为基础,通过参数输入调整各种方法的计算,最后通过用户界面将结果展现出来。

关键技术

移动对象轨迹数据挖掘的关键技术:

  • (1)基于结构特征的轨迹微观数据分析技术。基于结构特征的轨迹微观数据分析技术主要以从轨迹数据入手,深入研究轨迹数据的特征,从而完成对轨迹结构的抽取、计算和分析。
  • (2)基于协同过滤的对象宏观活动分析技术。在轨迹微观分析的基础上,应用移动对象微观的分析方法,从中发现与识别已知兴趣区域,找到移动对象潜在的兴趣区域。
  • (3)基于多粒度的对象活动的模式发现技术。应用基于密度聚类的方法发现在特定轨迹上对象活动较为集中的热点区域,并标记为一个对象活动,记录活动的相关属性,通过明确时间粒度和表示和转化关系,实现移动对象的多粒度周期活动挖掘,发现关联的周期活动、周期的长度、间隔时间等信息。

基于结构特征的轨迹分析方法

基于结构特征的轨迹数据分析方法主要可以分为 5 个步骤:

  • (1)轨迹数据的加载、重构。对数据的降噪处理,构建索引结构,然后进行重构。
  • (2)轨迹数据的转角计算与划分。计算轨迹的转向角,设定转角阈值,根据转角阈值对轨迹进行划分,保证每个轨迹片段都具有相对平稳的结构特征。
  • (3)轨迹结构特征的抽取。对轨迹进行结构建模并抽取轨迹的结构特征,根据移动对象的运动特点以及轨迹相关属性,抽取速度、方向、转角、密度等 等特征对轨迹进行表示。
  • (4)轨迹的结构相似度计算。通过结构相似度计算,生成的轨迹结构相似度矩阵,并将计算结果应用到轨迹聚类和异常检测等方法上。
  • (5)结果检验和验证。对分析效果进行验证,通过设置不同的参数验证该方法的可靠性和性能。

基于协同过滤的移动对象兴趣活动发现流程

基于协同过滤的移动对象兴趣活动发现步骤:

  • (1)确定轨迹中的停留点。对移动对象轨迹数据进行Stop-Move点识别,确定轨迹中的停留点。
  • (2)发现兴趣区域。采用聚类方法将属于同一停留区域的Stop点聚集起来,发现移动对象的兴趣区域。
  • (3)构建兴趣区域集合。根据对单个移动对象的每个兴趣区域访问进行信息收集和标注,包括:移动对象标识、兴趣区域表示,访问时间、停留时长、访问次数等信息,形成移动对象的兴趣区域集合。
  • (4)找出重叠区域。找出不同移动对象的兴趣区域在地理空间上具有一定的重叠。
  • (5)发现潜在的兴趣活动以及感兴趣的路径。利用协同过滤计算重叠的区域出现的次数、发生时刻、停留的时间等的相似程度,确定相似程度较高的移动对象为相似的对象,以相似的移动对象为基础发现他们之间潜在的兴趣活动以及感兴趣的路径。

基于多粒度的对象活动的模式发现

移动对象周期活动挖掘的步骤:

  • (1)明确描述形式。对时间空间、时间单元、时刻、时间粒度等进行形式化描述,明确时间粒度的表示方式,以及不同粒度的转换关系。
  • (2)确定移动对象的活动,通过基于密度的聚类方式,发现移动对象频繁停留区域,标记移动对象对该区域的访问为一个对象活动,记录对象活动的相关属性信息。
  • (3)对移动对象单个活动进行周期模式挖掘。针对移动对象单个活动分析其发生的时间特征,形成对象活动序列,通过计算支持度对活动对象组的频繁模式进行筛选和评价,过滤发生概率较低的周期模式。
  • (4)对移动对象关联活动进行周期模式挖掘,通过应用基于对象单活动周期模式发现的结果,计算对象活动的关联程度,发现关联度较高的对象活动,通过构造最大子模式树的方式进行对象关联活动的发现,最后通过支持度、和时间修正值对挖掘的移动对象关联周期模式进行调整。
  • (5)对活动发生时间进行多粒度描述,发现更为精准、全面的周期模式。

基于wifi的用户生活模式挖掘

(1)数据预处理。从wifi扫描列表提取数据,发现访问地点。

(2)构建移动图模型。基于用户在地点间的轨迹来构建移动图。

(3)基于地点时间特征的聚类质也叠加方法来识别所有用户的家和工作地点,通过分析用户在家和工作地的行为来理解用户作息规律

移动图模型构建

  • 访问地点发现。将wifi扫描列表作为位置指纹,发现用户的访问地点,这些地点是逻辑地点。
  • 停留点提取。每一个扫描列表都代表一个停留点,相似的停留点可能代表着用户对某个地点的多次访问,从原始wifi扫描列表数据中将代表停留点的扫描别表找出来,然后通过聚类将那些相近的停留点组合在一起便可W唯一表示一个访问地点。
  • 停留点聚类。每一个停留点都含有一些固定且频繁出现的wifi组合,可表征该地点的部分特征,为了找到可表该地点全部特征的wifi组合,对相似的停留点进行聚类,得到的停留点簇便是用户长时间逗留的访问地点。

用户区域活动特征发现

用户每天的轨迹其实就是移动图上由若干个访问地点构成的路径,用户规律性移动形成的大量路径将那些具有相似性质的结点联系起来,构成活动区域,在区域内结点之间联系紧密意味着用户移动较为频繁,而在区域间结点联系较为稀疏,意味着用户移动较少。

重要地点聚类。用户的重要地点发现问题可转为移动图中重要结点的发现问题,图中结点的重要性主要基于该结点与相邻结点的连接关系所展现的显著性,比如结点的度、最短路径和权值等基本属性。

shikanon wechat
欢迎您扫一扫,订阅我滴↑↑↑的微信公众号!