排序
一文读懂十二大深度神经网络
本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! beginning 一提到深度神经网络,大家脑海中第一个浮现的无疑是卷积神经网络(Convolutional Ne...
《深入浅出OCR》第二章:OCR技术发展与分类
⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
《深入浅出OCR》第一章:OCR技术导论
⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
【Dlib】动作检测:以常见的人脸识别验证为例讲解张嘴与闭眼
关键词: 人脸关键点 、张嘴 、 闭眼 、 动作检测 、 人脸验证 前言 动作检测是计算机视觉领域中的一个重要任务,它旨在识别图像或视频中的人体动作。常见的人脸识别验证是动作检测的一个应...
SVTR: Scene Text Recognition with a Single Visual Model 【论文翻译】
SVTR: Scene Text Recognition with a Single Visual Model 论文:https://arxiv.org/pdf/2205.00159.pdf 使用单一视觉模型进行场景文本识别 源码:https://github.com/PaddlePaddle/PaddleOCR ...
爆火论文“14行代码打败BERT”出现反转!改掉bug性能秒变最差
前言 50年前的kNN算法,只用14行代码在文本分类上超越风头正盛的Transformer,包括BERT 本文转载自量子位 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,专注于计算机视觉的技术...
【计算机视觉项目实战】中文场景识别
⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
CV大模型系列之:扩散模型基石DDPM(源码解读与实操篇)
⚠️⚠️⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! 终于来到扩散模型DDPM系列的最后一篇:源码解读了。本文将配合详细的图例,来为大家解...
Unity UGUI的AspectRatioFitter(宽高比适应器)组件的介绍及使用
Unity UGUI的AspectRatioFitter(宽高比适应器)组件的介绍及使用 1. 什么是AspectRatioFitter组件? AspectRatioFitter(宽高比适应器)是Unity UGUI中的一个组件,用于控制UI元素的宽高比例,...
《深入浅出OCR》前言知识(二):深度学习知识总结
⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
OpenCV入门教程:图片读取、保存和显示
公众号:尤而小屋作者:Peter编辑:Peter 大家好,我是Peter~ 工作的原因,最近开始涉及到很多图像处理的工作,所以决定开辟一个新专栏:OpenCV入门教程系列。 教程从零开始,记录自己的学习历...
《深入浅出OCR》前言知识:机器学习基础全面总结
⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
探索AI图像安全,助力可信AI发展
0. 前言 随着人工智能( Artificial Intelligence, AI )技术的发展,已经逐渐成为生活中不可或缺的一部分,为我们的生活带来了诸多便利和创新,但与此同时也带来了一系列的安全挑战,例如恶意篡...
《深入浅出OCR》前言知识:机器学习基础(二)
⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
《深入浅出OCR》前言知识:机器学习基础(一)
⚠️本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ✨专栏介绍: 经过几个月的精心筹备,本作者推出全新系列《深入浅出OCR》专栏,对标最全OCR教程...
Slide-Transformer是如何优化ViT的?丨论文解读
零、前言 ?本文为稀土掘金技术社区首发签约文章,30天内禁止转载,30天后未获授权禁止转载,侵权必究! ?欢迎访问: 个人博客:conqueror712.github.io/ 知乎:www.zhihu.com/people/soeu… Bil...
【姿态估计】从理论到实践逐步分析讲解传统姿态估计算法
前言 人脸姿态估计是指通过计算机视觉技术对人脸在三维空间中的旋转和平移进行估计。它涉及到识别人脸的朝向、头部的旋转角度和平移距离等信息。准确的人脸姿态估计可以为许多应用场景提供...
击败Stable Diffusion XL,商汤绘画大模型出手即大作,论文公开、免费试玩
前言 商汤大模型团队提出的文生图大模型RAPHAEL,可以生成具有高度艺术风格或者摄影风格的图片,速度极快。 本文转载自机器之心 仅用于学术分享,若侵权请联系删除 欢迎关注公众号CV技术指南,...
爬取 2 万多张 Flickr 图片,莫纳什大学复现 10 年间日本樱花开放的时空特征
内容一览: 近年来,全球气候变化形势严峻,由此引发的蝴蝶效应,正深刻地影响着人类和大自然。在这一背景下,收集数百甚至数千公里范围内开花模式的数据,了解气候变化如何对开花植物产生影响...
【实操:人脸矫正】两次定位操作解决人脸矫正问题
juejin.cn/post/712481… 前言 在实际应用中,由于各种因素的影响,采集到的人脸图像可能存在不同的问题,由于摄像机角度不同、人动作不一样,使得过滤后的人脸还是不满足我们进行特征提取...