排序
【姿态估计】从理论到实践逐步分析讲解传统姿态估计算法
前言 人脸姿态估计是指通过计算机视觉技术对人脸在三维空间中的旋转和平移进行估计。它涉及到识别人脸的朝向、头部的旋转角度和平移距离等信息。准确的人脸姿态估计可以为许多应用场景提供...
ICCV论文速读:SOTA!越简单,越强大!ByteTrackV2-通用2D、3D跟踪算法(开源)
前言 本文提出了一个分层的数据关联策略来寻找低分检测框中的真实目标,这缓解了目标丢失和轨迹不连续的问题。这个简单通用的数据关联策略在2D和3D设置下都表现良好。另外,由于在3D场景中预测...
X-Anylabeling: 一款多SOTA深度学习模型集成的新一代自动标注工具
Github: github.com/CVHub520/X-… 简介 X-AnyLabeling 是一款全新的交互式自动标注工具,其基于AnyLabeling进行构建和二次开发,在此基础上扩展并支持了许多的模型和功能,并借助Segment Anyth...
《深入浅出OCR》前言知识:机器学习基础(一)
⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
探索AI图像安全,助力可信AI发展
0. 前言 随着人工智能( Artificial Intelligence, AI )技术的发展,已经逐渐成为生活中不可或缺的一部分,为我们的生活带来了诸多便利和创新,但与此同时也带来了一系列的安全挑战,例如恶意篡...
可与ViT一较高下,DeepMind从稀疏转向Soft混合专家模型
前言 对于谷歌 DeepMind 的 Soft MoE,有人表示:「即使它不是万能药,仍可以算得上一个突破」。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算...
《深入浅出OCR》第三章:OCR文字检测
⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
深度学习应用篇-计算机视觉-目标检测[4]:综述、边界框bounding box、锚框(Anchor box)、交并比、非极大值抑制NMS、SoftNMS
深度学习应用篇-计算机视觉-目标检测[4]:综述、边界框bounding box、锚框(Anchor box)、交并比、非极大值抑制NMS、SoftNMS 1.目标检测综述 对计算机而言,能够“看到”的是图像被编码之后的...
Slide-Transformer是如何优化ViT的?丨论文解读
零、前言 ?本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ?欢迎访问: 个人博客:conqueror712.github.io/ 知乎:www.zhihu.com/people/soeu… Bil...
PP-Vehicle车辆跟踪模块
源码: www.hedaoapp.com/goods/goods… 【应用介绍】 车辆检测与跟踪在交通监控、自动驾驶等方向都具有广泛应用,PP-Vehicle中集成了检测跟踪模块,是车牌检测、车辆属性识别等任务的基础。我们...
CVPR’23|一张图重建3D人物新思路:完美复刻复杂动作和宽松衣物,遮挡也不在话下
前言 用一张人像直接打造3D数字人最大的挑战是什么?或许就是兼顾稳定性和自由度。 本文转载自量子位 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结...
Unity UGUI的Dropdown(下拉菜单)组件的介绍及使用
Unity UGUI的Dropdown(下拉菜单)组件的介绍及使用 1. 什么是Dropdown组件? Dropdown(下拉菜单)是Unity UGUI中的一个常用组件,用于在用户点击或选择时显示一个下拉菜单,提供多个选项供用...
open-mmlab/mmocr 环境搭建、推理和训练入门教程【一】
博文基础信息 mmocr.readthedocs.io/zh_CN/dev-1… 显卡,11G 1080Ti 本博文只是跟着官方文档进行一个 推理、训练、测试 代码试运行 涉及代码修改的地方,请参考官方文档 Linux 搭建 open-mmlab...
一文带你入门网络协议
众所周知,网络是一台台的计算机构成的一张“大网”,彼此通讯,交互数据。我们也都知道不同的计算机厂家生产的计算机肯定是存在差异的,那么它们是如何克服这些差异进行通信呢? 1.目录 网络协...
CV大模型系列之:扩散模型基石DDPM(源码解读与实操篇)
⚠️⚠️⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 终于来到扩散模型DDPM系列的最后一篇:源码解读了。本文将配合详细的图例,来为大家解...
TensorFlow2实战 | 第7周:咖啡豆识别
? 我的环境: 语言环境:Python3.10.11 编译器:Jupyter Notebook 深度学习框架:TensorFlow2.4.1 显卡(GPU):NVIDIA GeForce RTX 4070 ? 相关教程: 编译器教程:【新手入门深度学习 | 1-2:...
在树莓派上实现numpy的conv2d卷积神经网络做图像分类,加载pytorch的模型参数,推理mnist手写数字识别,并使用多进程加速
这几天又在玩树莓派,先是搞了个物联网,又在尝试在树莓派上搞一些简单的神经网络,这次搞得是卷积识别mnist手写数字识别 训练代码在电脑上,cpu就能训练,很快的: import torch import torch....
[论文阅读] 颜色迁移-梯度保护颜色迁移
[论文阅读] 颜色迁移-梯度保护颜色迁移 文章: [Gradient-Preserving Color Transfer], [代码未公开] 本文目的: 如题所示为梯度保护的颜色迁移方法. 1-算法原理 人类的视觉系统对局部强度差异比...
【计算机视觉项目实战】中文场景识别
⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
深度学习应用篇-计算机视觉-语义分割综述[5]:FCN、SegNet、Deeplab等分割算法、常用二维三维半立体数据集汇总、前景展望等
深度学习应用篇-计算机视觉-语义分割综述[5]:FCN、SegNet、Deeplab等分割算法、常用二维三维半立体数据集汇总、前景展望等 语义分割综述(semantic segmentation) 1.初识语义分割 1.1.计算机...