计算机视觉-五八三-第3页

CV大模型系列之：全面解读VIT，它到底给植树人挖了多少坑

⚠️⚠️⚠️本文为稀土掘金技术社区首发签约文章，30天内禁止转载，30天后未获授权禁止转载，侵权必究！大家好，最近越演越热的AIGC浪潮，将Transformer这个模型带进了大家的视野。如果你从事...

admin2年前

050

Unity UGUI的ScrollRect（滚动视图）组件的介绍及使用

Unity UGUI的ScrollRect（滚动视图）组件的介绍及使用 1. 什么是ScrollRect组件？ ScrollRect（滚动视图）是Unity UGUI中的一个常用组件，用于在UI界面中创建可滚动的区域。通过ScrollRect组件...

admin2年前

0210

Unity UGUI的Dropdown（下拉菜单）组件的介绍及使用

Unity UGUI的Dropdown（下拉菜单）组件的介绍及使用 1. 什么是Dropdown组件？ Dropdown（下拉菜单）是Unity UGUI中的一个常用组件，用于在用户点击或选择时显示一个下拉菜单，提供多个选项供用...

admin2年前

0120

Unity的AssetPostprocessor之Model：深入解析与实用案例 2

Unity AssetPostprocessor中Model相关函数的实际应用 Unity AssetPostprocessor是Unity引擎中的一个重要功能，它可以在导入资源时自动一些脚本，以便对资源进行自定义处理。其中，Model相关的函...

admin2年前

030

WideNet:让网络更宽而不是更深

前言本文介绍了新加坡国立大学在2022 aaai发布的一篇论文。WideNet是一种参数有效的框架，它的方向是更宽而不是更深。通过混合专家(MoE)代替前馈网络(FFN)，使模型沿宽度缩放。使用单独LN用于...

admin2年前

070

你大脑中的画面，现在可以高清还原了

前言 AI 直接把你脑中的创意画出来的时刻，已经到来了。本文转载自机器之心仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论...

admin2年前

040

TensorFlow2实战 | 第7周：咖啡豆识别

? 我的环境：语言环境：Python3.10.11 编译器：Jupyter Notebook 深度学习框架：TensorFlow2.4.1 显卡（GPU）：NVIDIA GeForce RTX 4070 ? 相关教程：编译器教程：【新手入门深度学习 | 1-2：...

admin2年前

0120

【Python】基于DLib库进行人脸识别

介绍 DLib库：一个机器学习的开源库，包含了机器学习的很多算法，使用起来很方便，直接包含头文件即可，并且不依赖于其他库（自带图像编解码库源码）Dlib可以帮助您创建很多复杂的机器学习方面...

admin2年前

060

MobileNet+Milvus 完成对街景图片的精确搜索（二）

前文书接上回，这次我对图像进行了复杂的变换操作，然后使用相关技术完成图片的精确搜素。数据处理首先我在百度中搜集了 107 张街景图片，然后使用下面的代码对每张图片进行了随机的处理，其...

admin2年前

020

open-mmlab/mmocr 环境搭建、推理和训练入门教程【一】

博文基础信息 mmocr.readthedocs.io/zh_CN/dev-1… 显卡，11G 1080Ti 本博文只是跟着官方文档进行一个推理、训练、测试代码试运行涉及代码修改的地方，请参考官方文档 Linux 搭建 open-mmlab...

admin2年前

0120

MaskFormer：将语义分割和实例分割作为同一任务进行训练

前言本文介绍了Facebook AI Research在21年发布的一种超越这些限制的实例分割方法MaskFormer。本文转载自DeepHub IMBA 作者 | HannaMergui 仅用于学术分享，若侵权请联系删除欢迎关注公众号C...

人工智能

admin2年前

050

vision kit 平面检测从入门到放弃

AR 增强现实，是指在真实世界的基础上，通过计算机生成的虚拟信息，将虚拟信息与真实世界进行融合，从而达到增强现实的效果。核心技术及相关技术栈想要实现 WebAR 效果，四个步骤：读取、识别...

前端

admin2年前

080

刷新20项代码任务SOTA，Salesforce提出新型基础LLM系列编码器-解码器Code T5+

前言大型语言模型 (LLMs) 最近在代码层面的一系列下游任务中表现十分出彩。通过对大量基于代码的数据 (如 GitHub 公共数据) 进行预训练，LLM 可以学习丰富的上下文表征，这些表征可以迁移到各...

人工智能

admin2年前

090

CVPR’23｜一张图重建3D人物新思路：完美复刻复杂动作和宽松衣物，遮挡也不在话下

前言用一张人像直接打造3D数字人最大的挑战是什么？或许就是兼顾稳定性和自由度。本文转载自量子位仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结...

人工智能

admin2年前

0120

浅谈OpenCV的多对象匹配图像的实现，以及如何匹配半透明控件，不规则图像

合集 - futz12的opencv学习日志(2)1.OpenCV一句话将彩色图片(Mat)转换为灰度06-122.浅谈OpenCV的多对象匹配图像的实现，以及如何匹配半透明控件，不规则图像06-24收起浅谈OpenCV的多对象匹配透...

博客文章

admin2年前

030

PP-Vehicle车辆跟踪模块

源码: www.hedaoapp.com/goods/goods… 【应用介绍】车辆检测与跟踪在交通监控、自动驾驶等方向都具有广泛应用，PP-Vehicle中集成了检测跟踪模块，是车牌检测、车辆属性识别等任务的基础。我们...

人工智能

admin2年前

0120

AI模型部署实战：利用CV-CUDA加速视觉模型部署流程

本文首发于公众号【DeepDriving】，欢迎关注。 CV-CUDA简介随着深度学习技术在计算机视觉领域的发展，越来越多的AI算法模型被用于目标检测、图像分割、图像生成等任务中，如何高效地在云端或者...

人工智能

admin2年前

080

iPhone两秒出图，目前已知的最快移动端Stable Diffusion模型来了

Stable Diffusion （SD）是当前最热门的文本到图像（text to image）生成扩散模型。尽管其强大的图像生成能力令人震撼，一个明显的不足是需要的计算资源巨大，推理速度很慢：以 SD-v1.5 为例，...

人工智能

admin2年前

030

【智慧交通项目实战】《 OCR车牌检测与识别》（二）：基于YOLO的车牌检测

?‍?作者简介： CSDN、阿里云人工智能领域博客专家，新星计划计算机视觉导师，百度飞桨PPDE，专注大数据与AI知识分享。 ✨公众号：GoAI的学习小屋，免费分享书籍、简历、导图等，更有交流群分...

人工智能

admin2年前

050

【智慧交通项目实战】 OCR车牌检测与识别项目实战（一）：项目总览

?‍?作者简介： CSDN、阿里云人工智能领域博客专家，新星计划计算机视觉导师，百度飞桨PPDE，专注大数据与AI知识分享。✨公众号：GoAI的学习小屋，免费分享书籍、简历、导图等，更有交流群分享...

人工智能

admin2年前

0160