算法共0篇 第2页
算法
大连理工联合阿里达摩院发布HQTrack | 高精度视频多目标跟踪大模型-五八三

大连理工联合阿里达摩院发布HQTrack | 高精度视频多目标跟踪大模型

Title: Tracking Anything in High QualityPDF: arxiv.org/pdf/2307.13…Code: github.com/jiawen-zhu/… 导读 本文介绍了一种名为HQTrack的高质量视频目标跟踪框架。视频目标跟踪是计算机视觉...
admin的头像-五八三admin2年前
0120
Google & CMU 新作 | 揭示 LLMs 在解决视觉任务方面的无限潜力-五八三

Google & CMU 新作 | 揭示 LLMs 在解决视觉任务方面的无限潜力

Title: SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs Paper: arxiv.org/pdf/2306.17… Code: github.com/google-rese… 导读 今天无意间看到谷歌和卡耐基梅...
admin的头像-五八三admin2年前
060
港中文联合上海AI Lab发布多模态(12种)学习统一框架:Meta-Transformer-五八三

港中文联合上海AI Lab发布多模态(12种)学习统一框架:Meta-Transformer

Title: Meta-Transformer: A Unified Framework for Multimodal LearningPDF: arxiv.org/pdf/2307.10…Code: github.com/invictus717… 导读 设计一个统一的网络来处理各种模态(例如自然语言、...
admin的头像-五八三admin2年前
0290
重新思考局部-全局上下文交互:SegNetr 在医学图像分割中的应用-五八三

重新思考局部-全局上下文交互:SegNetr 在医学图像分割中的应用

导读 论文:《SegNetr: Rethinking the local-global interactions and skip connections in U-shaped networks》 今天主要介绍了一种名为SegNetr的轻量级医学图像分割网络,并针对传统编解码网...
admin的头像-五八三admin2年前
0140
ICCV 2023 | APE: 高效的 CLIP 图像分类适配算法,比 Tip-Adapter 参数少30倍-五八三

ICCV 2023 | APE: 高效的 CLIP 图像分类适配算法,比 Tip-Adapter 参数少30倍

论文:Not All Features Matter: Enhancing Few-shot CLIP with Adaptive Prior Refinement 链接:arxiv.org/pdf/2304.01… 代码:github.com/yangyangyan… 导读 TL;DR: 本文基于 CLIP 提出了...
admin的头像-五八三admin2年前
0150
港中文 & 苏大发布中文语法纠错大模型GrammarGPT | 仅用1K数据进行指令微调即可达到SOTA性能!-五八三

港中文 & 苏大发布中文语法纠错大模型GrammarGPT | 仅用1K数据进行指令微调即可达到SOTA性能!

Title: GrammarGPT: Exploring Open-Source LLMs for Native Chinese Grammatical Error Correction with Supervised Fine-TuningPDF: arxiv.org/pdf/2307.13…Code: github.com/freedominte… ...
admin的头像-五八三admin2年前
0450
Meta AI开源力作 | SiLK:你真的需要这么复杂的图像关键点提取器?-五八三

Meta AI开源力作 | SiLK:你真的需要这么复杂的图像关键点提取器?

Title: SiLK: Simple Learned Keypoints Paper: arxiv.org/pdf/2304.06… Code: github.com/facebookres… 导读 关键点检测和描述符是计算机视觉任务(如图像匹配、3D重建和视觉里程计)的基础...
admin的头像-五八三admin2年前
0190
ICCV 2023 | 南开程明明团队提出新颖注意力机制用于图像超分辨率任务-五八三

ICCV 2023 | 南开程明明团队提出新颖注意力机制用于图像超分辨率任务

导读 TL;DR: 本文提出了一种新的置换自注意力(PSA)用于图像超分辨率任务,可以在保持计算成本较低的同时,处理大窗口自注意力,并基于PSA构建了一个新的超分辨率网络,SRFormer,在各项基准测...
admin的头像-五八三admin2年前
0200
中科院一区顶刊 | DilateFormer: 即插即用的多尺度全局注意力机制(附源码实现)-五八三

中科院一区顶刊 | DilateFormer: 即插即用的多尺度全局注意力机制(附源码实现)

导读 论文:《DilateFormer: Multi-Scale Dilated Transformer for Visual Recognition》 本文提出了一种新颖的多尺度空洞 Transformer,简称DilateFormer,以用于视觉识别任务。原有的 ViT 模...
admin的头像-五八三admin2年前
0160
无惧暗光!| PE-YOLO: 夜视环境物体检测新突破(附源码实现)-五八三

无惧暗光!| PE-YOLO: 夜视环境物体检测新突破(附源码实现)

导读 论文:《PE-YOLO: Pyramid Enhancement Network for Dark Object Detection》 TL;DR: 本文核心内容在于解决在暗光照射条件下进行物体检测的问题。作者建立了一个名为PE-YOLO的暗光物体检测...
admin的头像-五八三admin2年前
0140
ICCV 2023 | 超越 NanoDet, 腾讯联合比特币矿机制造商MicroBT发表 68.77k 的超轻量目标检测器!-五八三

ICCV 2023 | 超越 NanoDet, 腾讯联合比特币矿机制造商MicroBT发表 68.77k 的超轻量目标检测器!

导读 论文:《FemtoDet: An Object Detection Baseline for Energy Versus Performance Tradeoffs》 各位小伙伴早上好,昨天为大家解读了一篇最新发表在 MICCAI 2023 的医学图像语义分割工作,...
admin的头像-五八三admin2年前
060
ICCV 2023 | Pixel-based MIM: 简单高效的多级特征融合自监督方法-五八三

ICCV 2023 | Pixel-based MIM: 简单高效的多级特征融合自监督方法

导读 论文:《Improving Pixel-based MIM by Reducing Wasted Modeling Capability》 问题背景:Masked Image Modeling, MIM 是一种有效的自监督学习框架,但现有的基于像素的 MIM 方法倾向于过...
admin的头像-五八三admin2年前
080
KAUST & Meta AI 新作 | ZeroSeg: 无需语义标签和文本信息,开放词汇语义分割一把梭哈!-五八三

KAUST & Meta AI 新作 | ZeroSeg: 无需语义标签和文本信息,开放词汇语义分割一把梭哈!

导读 论文:《Exploring Open-Vocabulary Semantic Segmentation without Human Labels》 TL;DR: 今天主要为大家介绍一种名为ZeroSeg的新方法,用于训练开放词汇的零样本(zero-shot)语义分割...
admin的头像-五八三admin2年前
0150
ICCV 2023 | 中科大联合 MSRA 提出轻量级神经网络架构 AFFNet: 自适应频率滤波器-五八三

ICCV 2023 | 中科大联合 MSRA 提出轻量级神经网络架构 AFFNet: 自适应频率滤波器

导读 论文:《Adaptive Frequency Filters As Efficient Global Token Mixers》 TL;DR: 本文主要通过使用卷积定理,揭示自适应频率滤波器可以作为有效的全局token混合器。这使得全局token混合可...
admin的头像-五八三admin2年前
0180
中科院一区顶刊 | BACL: 解决长尾目标检测的统一框架,显著提升 16.1 AP!-五八三

中科院一区顶刊 | BACL: 解决长尾目标检测的统一框架,显著提升 16.1 AP!

导读 论文:《Balanced Classification: A Unified Framework for Long-Tailed Object Detection》 TL;DR: 本文针对长尾物体检测问题提出了一种新颖的解决方案,即 BACL 框架。通过前景分类平衡...
admin的头像-五八三admin2年前
0140
ICCV 2023 | FocalFormer3D: 解决假阴性问题,提升自动驾驶3D目标检测召回率-五八三

ICCV 2023 | FocalFormer3D: 解决假阴性问题,提升自动驾驶3D目标检测召回率

导读 论文:《Focusing on Hard Instance for 3D Object Detection》 今天介绍的FocalFormer3D方法核心是围绕False Negatives, FN即假阴性进行展开的。众所周知,假阴性在 3D 物体检测中是一个...
admin的头像-五八三admin2年前
090
环路检测在风控领域的应用实践丨Fabarta 技术专栏-五八三

环路检测在风控领域的应用实践丨Fabarta 技术专栏

导读: 本文分享了在使用图分析引擎开发风控算法时遇到的挑战,以及我们采取的方案和措施,介绍环路检测算法在风控场景的探索和工程化方案,分享算法效率优化、硬件资源限制下的算法探索的一些...
admin的头像-五八三admin2年前
0160

正态检查相关算法

概念: 正态检验,也被称为正态性检验,是一种统计方法,用于检验一个数据集是否符合正态分布。正态分布,也被称为高斯分布,是一种在自然和社会科学中常见的连续概率分布。 正态性检验的重要性...
admin的头像-五八三admin2年前
0340
如何攻击神经网络?人工智能VS人工智障-五八三

如何攻击神经网络?人工智能VS人工智障

一、前言 自2012年起,人工智能快速发展,频繁出现在大众视野。从Alpha GO到ChatGPT,人工智能已成为不可阻挡的发展趋势。但是由于神经学习的黑盒性质,导致神经网络难以解释,且难以控制。即使...
admin的头像-五八三admin2年前
0110
算法套路三_二分查找——红蓝染色法-五八三

算法套路三_二分查找——红蓝染色法

算法套路三:二分查找——红蓝染色法 套路示例:LeetCode34. 在排序数组中查找元素的第一个和最后一个位置 给你一个按照非递减顺序排列的整数数组 nums,和一个目标值 target。请你找出给定目标...
admin的头像-五八三admin2年前
0170