计算机视觉-五八三

Unity UGUI的ScrollRect（滚动视图）组件的介绍及使用 1. 什么是ScrollRect组件？ ScrollRect（滚动视图）是Unity UGUI中的一个常用组件，用于在UI界面中创建可滚动的区域。通过ScrollRect组件...

admin2年前

0210

《深入浅出OCR》第三章：OCR文字检测

⚠️本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究！ ✨专栏介绍：经过几个月的精心筹备，本作者推出全新系列《深入浅出OCR》专栏，对标最全OCR教程...

admin2年前

0130

X-Anylabeling: 一款多SOTA深度学习模型集成的新一代自动标注工具

Github: github.com/CVHub520/X-… 简介 X-AnyLabeling 是一款全新的交互式自动标注工具，其基于AnyLabeling进行构建和二次开发，在此基础上扩展并支持了许多的模型和功能，并借助Segment Anyth...

人工智能

admin2年前

0140

OpenCV入门教程：图片读取、保存和显示

公众号：尤而小屋作者：Peter编辑：Peter 大家好，我是Peter~ 工作的原因，最近开始涉及到很多图像处理的工作，所以决定开辟一个新专栏：OpenCV入门教程系列。教程从零开始，记录自己的学习历...

admin2年前

040

vision kit 平面检测从入门到放弃

AR 增强现实，是指在真实世界的基础上，通过计算机生成的虚拟信息，将虚拟信息与真实世界进行融合，从而达到增强现实的效果。核心技术及相关技术栈想要实现 WebAR 效果，四个步骤：读取、识别...

前端

admin2年前

080

图注意力网络论文详解和PyTorch实现

前言图神经网络(gnn)是一类功能强大的神经网络，它对图结构数据进行操作。它们通过从节点的局部邻域聚合信息来学习节点表示(嵌入)。这个概念在图表示学习文献中被称为“消息传递”。本文转载...

admin2年前

090

CV大模型系列之：全面解读VIT，它到底给植树人挖了多少坑

⚠️⚠️⚠️本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究！大家好，最近越演越热的AIGC浪潮，将Transformer这个模型带进了大家的视野。如果你从事...

admin2年前

050

Unity 编辑器资源导入处理函数 OnPreprocessAudio ：深入解析与实用案例

Unity 编辑器资源导入处理函数 OnPreprocessAudio 用法点击封面跳转下载页面简介在 Unity 中，资源导入是一个非常重要的环节，它决定了资源在项目中的使用方式和效果。Unity 提供了一系列的...

admin2年前

090

iPhone两秒出图，目前已知的最快移动端Stable Diffusion模型来了

Stable Diffusion （SD）是当前最热门的文本到图像（text to image）生成扩散模型。尽管其强大的图像生成能力令人震撼，一个明显的不足是需要的计算资源巨大，推理速度很慢：以 SD-v1.5 为例，...

人工智能

admin2年前

030

《深入浅出OCR》前言知识（二）：深度学习知识总结

admin2年前

0500

MaskFormer：将语义分割和实例分割作为同一任务进行训练

前言本文介绍了Facebook AI Research在21年发布的一种超越这些限制的实例分割方法MaskFormer。本文转载自DeepHub IMBA 作者 | HannaMergui 仅用于学术分享，若侵权请联系删除欢迎关注公众号C...

人工智能

admin2年前

050

ICCV 2023 | 腾讯优图实验室16篇论文入选，含掌纹生成，人脸隐私保护，图像和谐化等研究方向

前言作为全球计算机领域顶级的学术会议之一，ICCV2023（International Conference on Computer Vision）国际计算机视觉大会将于今年10月在法国巴黎举行。近日，ICCV公布了论文录用结果，本届会...

admin2年前

080

深度学习应用篇-计算机视觉-图像分类[2]：LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍

深度学习应用篇-计算机视觉-图像分类[2]：LeNet、AlexNet、VGG、GoogleNet、DarkNet模型结构、实现、模型特点详细介绍 1.LeNet（1998） LeNet是最早的卷积神经网络之一[1]，其被提出用于识别手...

人工智能博客文章

admin2年前

050

【实操：人脸矫正】两次定位操作解决人脸矫正问题

juejin.cn/post/712481… 前言在实际应用中，由于各种因素的影响，采集到的人脸图像可能存在不同的问题，由于摄像机角度不同、人动作不一样，使得过滤后的人脸还是不满足我们进行特征提取...

admin2年前

070

CV大模型系列之：多模态经典之作CLIP，探索图文结合的奥秘

⚠️⚠️⚠️本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究！在本系列之前的文章中，我们曾经讲过VIT（Vision Transformer），一个借助Transformer ...

admin2年前

0610

深度学习应用篇-计算机视觉-视频分类[8]：时间偏移模块（TSM）、TimeSformer无卷积视频分类方法、注意力机制

深度学习应用篇-计算机视觉-视频分类[8]：时间偏移模块（TSM）、TimeSformer无卷积视频分类方法、注意力机制 1.时间偏移模块（TSM）视频流的爆炸性增长为以高精度和低成本执行视频理解任务带来...

人工智能

admin2年前

040

Unity UGUI的AspectRatioFitter（宽高比适应器）组件的介绍及使用

Unity UGUI的AspectRatioFitter（宽高比适应器）组件的介绍及使用 1. 什么是AspectRatioFitter组件？ AspectRatioFitter（宽高比适应器）是Unity UGUI中的一个组件，用于控制UI元素的宽高比例，...

admin2年前

050

open-mmlab/mmocr 环境搭建、推理和训练入门教程【一】

博文基础信息 mmocr.readthedocs.io/zh_CN/dev-1… 显卡，11G 1080Ti 本博文只是跟着官方文档进行一个推理、训练、测试代码试运行涉及代码修改的地方，请参考官方文档 Linux 搭建 open-mmlab...

admin2年前

0120

一文带你入门网络协议

众所周知，网络是一台台的计算机构成的一张“大网”，彼此通讯，交互数据。我们也都知道不同的计算机厂家生产的计算机肯定是存在差异的，那么它们是如何克服这些差异进行通信呢？ 1.目录网络协...

admin2年前

0120

tensorflow 孪生网络计算卫星图像的相似度

前文这里使用孪生结构的深度学习网络模型，实现了对卫星图像对进行相似度判断的任务，需要准备如下： tensorflow-gpu==2.10.0 python==3.10 地图数据 huggingface.co/datasets/hu… 数据处理 ...

人工智能

admin2年前

0180

12 3 4 下一页