ESC
输入关键词搜索文章
目录

Graph Embedded Pose Clustering for Anomaly Detection

Related article

Questions

arxiv 2404.19760

  1. 如何区分异常数据与正常数据?
    1. 见此处 google 异常检测
  2. 如何利用了视频数据的时序性?
    1. 视频长度不同怎么处理?
      1. split 成固定长度相互重叠的视频片段
  3. 如何使用GCN?
    1. 如何保存结点位置信息,从而得到角度等信息?
    2. 如何得到运动速度等信息?
  4. 如何聚类?
    1. K-means 初始化聚类
  5. 使用了什么损失函数?
    1. 预训练时有一个reconstruction loss。fine-tuning 时有一个clustering loss. 二者线性叠加。
  6. cluster的数量是预先设置好的吗?

Methods

Innovation

advantage

  1. wiki.zh 异常检测领域两种问题此算法都可以处理

History

How does this field developed ?

google Reconstructive model

使用construction and predictive branches来重建过去的pose,预测未来的pose,从而计算anomaly score.

wiki.en GCN

本文使用github yysijie/st-gcn 分别计算时间与空间的图卷积。

Deep Clustering Models

深度聚类方法旨在通过在聚类诱导目标(cluster inducing objecive)下优化深度模型来提供有用的聚类分配。

Deep Embedded Clustering(DEC)中提出的的两步方法: 第一步,使用当前聚类分配计算目标分布。在下一步中,模型被优化以提供与目标分布类似的聚类分配。最近的扩展使用正则化方法和各种后处理手段解决了 DEC 对退化解决方案的敏感性

model architecture

Pasted image 20240421093833.png

key points

feature extraction

Pasted image 20240421101612.png

  1. 空间注意力
  2. 时间注意力

    输入时空图,输出得到一个embedding,以此作为clustering branch的起点

Spatial Attention Graph Convolution

Pasted image 20240421102121.png

三个google GCN ,处理三个adjacent matrix。

B:初始化一个全连接层,并有一个邻接矩阵,由于结点数量有限,计算难度不会太大。 C:graph self-attention layer. multiplicative attention mechanism.可以把attention mechanism 换成其他的模块。

Deep Embedding Clustering

  1. encoder
  2. decoder
  3. soft-cluster layer

    保持图的结构,但是用large temporal stride and increasing channel number 来压缩输入序列得到latent vector。Decoder使用时间up-sampling以及additional graph convolutional blocks逐渐恢复原始通道数与时间维度。

    ST-GCAE的输出是clustering的起点。输入是x,embedding得到的latent vector是z,聚类完以后得到的是y。

    计算出样本属于每一个聚类的可能性。

    计算当前分布与目标分布之间的KL散度。 GAN D-math

    要让概率趋近于0或者1。

    期望最大化。

Dirichlet Process Mixture Model(DPMM)

Dirichlet process 两种多模态分布:

  1. 聚类分配层面 cluster assignment。一个动作可以被分给多个聚类。从而就有multimodal soft-assignment vector。

  2. soft-assignment level

  3. 估计(拟合)阶段,在此期间评估一组分布参数,

  4. 推理阶段,使用拟合模型为每个嵌入样本提供分数。

狄利克雷过程混合模型(Dirichlet Process Mixture Model, DPMM) | 数据学习者官方网站(Datalearner)

徐亦达机器学习:Dirichlet Process 狄利克雷过程【2015年版-全集】_哔哩哔哩_bilibili

训练

两个阶段的训练

  1. pre-training for Autoencoder : clustering branch remains unchanged
  2. fine-tuning stage: 嵌入与聚类都被优化。
    1. K-means 初始化聚类

hyper-parameter

loss

$$L_{combined} = L_{rec} + \lambda \cdot L_{cluster}$$

volume and speed

experiment

fine-grained ShanghaiTech dataset

coarse-grained anomaly detection

  1. random split
    • split sample and non-split sample. 没有label。
      • low vs many
      • many vs low
  2. meaningful split

ablation study

Pasted image 20240421150412.png 加入noise data,看会对模型的性能造成多大的影响。

Efficiency and effect of the model 模型效果

Pasted image 20240421144457.png

advantage and disadvantage of the model

Pasted image 20240421145642.png 难题

  1. 多人重叠,那么人就只能被部分检测到。由此,同一人员在不同帧之间的分数变化很大。同时,异常成分(一个滑滑板的人)被时常遮挡。
  2. 移动速度过快造成人像模糊,从而无法提取pose,那么也就不能进行分析
  3. 车辆遮挡