论文信息 - Integrating Vision Transformer-Based Bilinear Pooling and Attention Network Fusion of RGB and Skeleton Features for Human Action Recognition - 字舞流文

Integrating Vision Transformer-Based Bilinear Pooling and Attention Network Fusion of RGB and Skeleton Features for Human Action Recognition

Xiaoyi Yu | Yaohui Sun | Weiyao Xu | Ju Gao | Ting Xia