问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

MoveNet-谷歌轻量级人体姿态估计算法

发布网友 发布时间:2024-09-05 04:34

我来回答

1个回答

热心网友 时间:2024-09-28 02:51

MoveNet

Google提供的在线演示:storage.googleapis.com/...

MoveNet 是一个 Bottom-up estimation model, 使用heatmap。

网络架构

主要分为三个部分:Backbone、Header、PostProcess

- Backbone:Mobilenetv2 + FPN

- Header:输入为Backbone的特征图,经过各自的卷积,输出各自维度的特征图。共有四个Header:分别为Center、KeypointRegression、KeypointHeatmap、Local Offsets

- Center:[N, 1, H, W], 这里1代表当前图像上所有人中心点的Heatmap,可以理解为关键点,只有一个,所以通道为1。提取中心点两种方式:

- 一个人所有关键点的算术平均数。

- 所有关键点最大外接矩形的中心点。(效果更好)

- KeypointHeatmap:[N, K, H, W] N:Batchsize、K:关键点数量,比如17。H、W:对应特征图的大小,这里输入为$192 \times 192$ , 降采样四倍就是$48\times 48$ 。代表当前图像上所有人的关键点的Heatmap

- KeypointRegresssion:[N, 2K, H, W] K个关键点,坐标用$x, y$表示,那么就有2K个数据。这里$x, y$ 代表的是同一个人的关键点对于中心点的偏移值。原始MoveNet用的是特征图下的绝对偏移值,换成相对值(除以48转换到0-1),可以加快收敛。

- LocalOffsets:[N, 2K, H, W] 对应K个关键点的坐标,这里是Offset,模型降采样特征图可能存在量化误差,比如192分辨率下x = 0 和 x= 3映射到48分辨率的特征图时坐标都变为了0;同时还有回归误差。

损失函数

KeypointHeadmap 和 Center 采用加权MSE,平衡了正负样本。 KeypointRegression 和LocalOffsets 采用了 L1 Loss。 最终各个Loss权重设置为1:1:1:1

参考文献快速开始

全流程引导进行项目生成,实现数据生成、训练、测试一体化

解压数据集配置项目环境训练测试

进入config.py 修改配置文件,修改测试图片路径。

测试结果Heatmap导出模型

个人介绍

姓名: 芦星宇 学校: 江苏科技大学 人工智能专业 本三 研究方向:姿态估计、图网络、异常检测 Github: github.com/Xingyu-Roman...

热心网友 时间:2024-09-28 02:58

MoveNet

Google提供的在线演示:storage.googleapis.com/...

MoveNet 是一个 Bottom-up estimation model, 使用heatmap。

网络架构

主要分为三个部分:Backbone、Header、PostProcess

- Backbone:Mobilenetv2 + FPN

- Header:输入为Backbone的特征图,经过各自的卷积,输出各自维度的特征图。共有四个Header:分别为Center、KeypointRegression、KeypointHeatmap、Local Offsets

- Center:[N, 1, H, W], 这里1代表当前图像上所有人中心点的Heatmap,可以理解为关键点,只有一个,所以通道为1。提取中心点两种方式:

- 一个人所有关键点的算术平均数。

- 所有关键点最大外接矩形的中心点。(效果更好)

- KeypointHeatmap:[N, K, H, W] N:Batchsize、K:关键点数量,比如17。H、W:对应特征图的大小,这里输入为$192 \times 192$ , 降采样四倍就是$48\times 48$ 。代表当前图像上所有人的关键点的Heatmap

- KeypointRegresssion:[N, 2K, H, W] K个关键点,坐标用$x, y$表示,那么就有2K个数据。这里$x, y$ 代表的是同一个人的关键点对于中心点的偏移值。原始MoveNet用的是特征图下的绝对偏移值,换成相对值(除以48转换到0-1),可以加快收敛。

- LocalOffsets:[N, 2K, H, W] 对应K个关键点的坐标,这里是Offset,模型降采样特征图可能存在量化误差,比如192分辨率下x = 0 和 x= 3映射到48分辨率的特征图时坐标都变为了0;同时还有回归误差。

损失函数

KeypointHeadmap 和 Center 采用加权MSE,平衡了正负样本。 KeypointRegression 和LocalOffsets 采用了 L1 Loss。 最终各个Loss权重设置为1:1:1:1

参考文献快速开始

全流程引导进行项目生成,实现数据生成、训练、测试一体化

解压数据集配置项目环境训练测试

进入config.py 修改配置文件,修改测试图片路径。

测试结果Heatmap导出模型

个人介绍

姓名: 芦星宇 学校: 江苏科技大学 人工智能专业 本三 研究方向:姿态估计、图网络、异常检测 Github: github.com/Xingyu-Roman...
MoveNet-谷歌轻量级人体姿态估计算法

- KeypointRegresssion:[N, 2K, H, W] K个关键点,坐标用$x, y$表示,那么就有2K个数据。这里$x, y$ 代表的是同一个人的关键点对于中心点的偏移值。原始MoveNet用的是特征图下的绝对偏移值,换成相对值(除以48转换到0-1),可以加快收敛。- LocalOffsets:[N, 2K, H, W] 对应K个...

ZESTRON表界面分析

在Dr. O.K. Wack Chemie GmbH,我们高度重视ZESTRON的表界面分析技术。该技术通过深入研究材料表面与界面的性质,为提升产品质量与可靠性提供了有力支持。ZESTRON的表界面分析不仅涵盖了相变化、化学反应、吸附与解吸等关键领域,还通过高精度仪器如固体表面Zeta电位分析仪等,确保数据准确可靠。这些分析手段对于优化产品配方、改进生产工艺、预防失效问题等具有重要意义,是我们不断提升产品性能与质量的重要工具。表面污染分析包括评估表面上存在的颗粒、残留物或物质。通过利用显微镜、光谱学和色谱法等技术,分析人员可以识别和表征污染物,以确定其成分和来源。这种分析在电子、制药和制造等各个行业中至关重要,以确保产品质量、性能和安全性。了解表面...

2021轻量级人体姿态估计模型修炼之路(附谷歌MoveNet复现经验)

在优化Lightweight OpenPose后,作者偶然发现了谷歌开源的MoveNet模型,并对其进行了复现。通过分析MoveNet模型结构和后处理流程,作者复现了该模型,并进行了进一步的优化,最终在验证集和测试集上实现了接近饱和的精度,同时将速度提升至嵌入式CPU上能跑到60+ms。总结与展望:整个探索过程展示了从需求分析、方...

人体姿态估计算法 整车姿态角估计算法 姿态解算算法 人脸姿态算法 姿态解算滤波算法 谷歌算法升级 谷歌人工智能算法框架 姿态算法 姿态融合算法
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
重本和一本一样吗 永劫无间是第几人称:小说叙事视角分析 名字未定(第三人称双男主 周霖 温宿) 我得了职业病〈轻度苯中毒〉,有职业病诊断证明书.工伤认定期间我没上... ...后来感觉麻烦,就直接去药店买药,他开了很多 这是十年前的功放,求高手看看那几个孔是什么? 车子断保险之后再交是一样的吗 车险断交后再续交 女性查激素六项什么时候检查 有一个素质很低下的室友是一种什么样的体验? 新鲜笋子煮麻辣鱼怎么做 笋子煮麻辣鱼的做法 10 款强大的Excel人工智能工具,百倍提高工作效率 【稀疏感知】基于稀疏感知的网络测量与时间序列异常检测 生成式人工智能库和平台相关介绍有哪些? 低秩稀疏矩阵分解+导向滤波消除显示屏照片摩尔纹 机器学习 | Schatten范数 净资产利润是什么意思 净资产和利润什么关系 什么是集合数学 什么是集合数学概念 净利润 净资产是什么 净资产净利润什么关系 净资产与净利润是什么 乌鲁木齐初三毕业考不上高中怎么办? 净资产是什么净利润么 lu是什么 集合的概念什么是集合 lu在网络语言中是什么意思? 网上买口红买啥牌子好一些?打算送给喜欢的女孩子 电子警察违法行政复议能申请赔偿吗 为什么"一切集合的集合"是不存在的? 伪素颜的口红色号有什么推荐的? go最好的微服务框架(go比较好的微服务框架) 函数y=25-x²的图像是怎么样的? 乱世王者资源田怎么分配介绍_乱世王者资源田怎么分配是什么 乱世王者联盟官位怎么分介绍_乱世王者联盟官位怎么分是什么 手机个大品牌市场占有率 西方三圣像求子女学业贡些什么 全球十大手机品牌排行手机品牌大全一览表 准提咒孩子可以念吗 怎么给孩子念文殊 西兰花变颜色了还能吃吗 什么情形可以收回出让土地使用权 交互设计师如何进行一个产品的交互设计? 郑州金水东路上的汇通驾校怎么样,安排考试快么,练车人多不,外地户口怎... 硕鼠flv视频下载器v2.4.8.2去广告绿色版下载介绍_硕鼠flv视频下载器v... 求大神告诉2015年禹州的汇通驾校要隔多久才能考试科目三? 手机号码怎么选择好呢? 湖南医药学院市场营销专业是在哪个校区 湖南医药学院市场营销在哪实习 湖南中医药大学有没有医药营销专业 湖南中医药大学营销专业可考硕研么