算法-五八三-第2页

大连理工联合阿里达摩院发布HQTrack | 高精度视频多目标跟踪大模型

Title: Tracking Anything in High QualityPDF: arxiv.org/pdf/2307.13…Code: github.com/jiawen-zhu/… 导读本文介绍了一种名为HQTrack的高质量视频目标跟踪框架。视频目标跟踪是计算机视觉...

admin2年前

0120

Google & CMU 新作 | 揭示 LLMs 在解决视觉任务方面的无限潜力

Title: SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs Paper: arxiv.org/pdf/2306.17… Code: github.com/google-rese… 导读今天无意间看到谷歌和卡耐基梅...

admin2年前

060

港中文联合上海AI Lab发布多模态(12种)学习统一框架：Meta-Transformer

Title: Meta-Transformer: A Unified Framework for Multimodal LearningPDF: arxiv.org/pdf/2307.10…Code: github.com/invictus717… 导读设计一个统一的网络来处理各种模态（例如自然语言、...

admin2年前

0290

重新思考局部-全局上下文交互：SegNetr 在医学图像分割中的应用

导读论文：《SegNetr: Rethinking the local-global interactions and skip connections in U-shaped networks》今天主要介绍了一种名为SegNetr的轻量级医学图像分割网络，并针对传统编解码网...

admin2年前

0140

ICCV 2023 | APE: 高效的 CLIP 图像分类适配算法，比 Tip-Adapter 参数少30倍

论文：Not All Features Matter: Enhancing Few-shot CLIP with Adaptive Prior Refinement 链接：arxiv.org/pdf/2304.01… 代码：github.com/yangyangyan… 导读 TL;DR: 本文基于 CLIP 提出了...

admin2年前

0150

港中文 & 苏大发布中文语法纠错大模型GrammarGPT | 仅用1K数据进行指令微调即可达到SOTA性能！

Title: GrammarGPT: Exploring Open-Source LLMs for Native Chinese Grammatical Error Correction with Supervised Fine-TuningPDF: arxiv.org/pdf/2307.13…Code: github.com/freedominte… ...

admin2年前

0450

Meta AI开源力作 | SiLK：你真的需要这么复杂的图像关键点提取器？

Title: SiLK: Simple Learned Keypoints Paper: arxiv.org/pdf/2304.06… Code: github.com/facebookres… 导读关键点检测和描述符是计算机视觉任务（如图像匹配、3D重建和视觉里程计）的基础...

admin2年前

0190

ICCV 2023 | 南开程明明团队提出新颖注意力机制用于图像超分辨率任务

导读 TL;DR: 本文提出了一种新的置换自注意力（PSA）用于图像超分辨率任务，可以在保持计算成本较低的同时，处理大窗口自注意力，并基于PSA构建了一个新的超分辨率网络，SRFormer，在各项基准测...

admin2年前

0200

中科院一区顶刊 | DilateFormer: 即插即用的多尺度全局注意力机制(附源码实现)

导读论文：《DilateFormer: Multi-Scale Dilated Transformer for Visual Recognition》本文提出了一种新颖的多尺度空洞 Transformer，简称DilateFormer，以用于视觉识别任务。原有的 ViT 模...

admin2年前

0160

无惧暗光！| PE-YOLO: 夜视环境物体检测新突破（附源码实现）

导读论文：《PE-YOLO: Pyramid Enhancement Network for Dark Object Detection》 TL;DR: 本文核心内容在于解决在暗光照射条件下进行物体检测的问题。作者建立了一个名为PE-YOLO的暗光物体检测...

admin2年前

0140

ICCV 2023 | 超越 NanoDet, 腾讯联合比特币矿机制造商MicroBT发表 68.77k 的超轻量目标检测器！

导读论文：《FemtoDet: An Object Detection Baseline for Energy Versus Performance Tradeoffs》各位小伙伴早上好，昨天为大家解读了一篇最新发表在 MICCAI 2023 的医学图像语义分割工作，...

admin2年前

060

ICCV 2023 | Pixel-based MIM: 简单高效的多级特征融合自监督方法

导读论文：《Improving Pixel-based MIM by Reducing Wasted Modeling Capability》问题背景：Masked Image Modeling, MIM 是一种有效的自监督学习框架，但现有的基于像素的 MIM 方法倾向于过...

admin2年前

080

KAUST & Meta AI 新作 | ZeroSeg: 无需语义标签和文本信息，开放词汇语义分割一把梭哈！

导读论文：《Exploring Open-Vocabulary Semantic Segmentation without Human Labels》 TL;DR: 今天主要为大家介绍一种名为ZeroSeg的新方法，用于训练开放词汇的零样本（zero-shot）语义分割...

admin2年前

0150

ICCV 2023 | 中科大联合 MSRA 提出轻量级神经网络架构 AFFNet: 自适应频率滤波器

导读论文：《Adaptive Frequency Filters As Efficient Global Token Mixers》 TL;DR: 本文主要通过使用卷积定理，揭示自适应频率滤波器可以作为有效的全局token混合器。这使得全局token混合可...

admin2年前

0180

中科院一区顶刊 | BACL: 解决长尾目标检测的统一框架，显著提升 16.1 AP!

导读论文：《Balanced Classification: A Unified Framework for Long-Tailed Object Detection》 TL;DR: 本文针对长尾物体检测问题提出了一种新颖的解决方案，即 BACL 框架。通过前景分类平衡...

admin2年前

0140

ICCV 2023 | FocalFormer3D: 解决假阴性问题，提升自动驾驶3D目标检测召回率

导读论文：《Focusing on Hard Instance for 3D Object Detection》今天介绍的FocalFormer3D方法核心是围绕False Negatives, FN即假阴性进行展开的。众所周知，假阴性在 3D 物体检测中是一个...

admin2年前

090

环路检测在风控领域的应用实践丨Fabarta 技术专栏

导读：本文分享了在使用图分析引擎开发风控算法时遇到的挑战，以及我们采取的方案和措施，介绍环路检测算法在风控场景的探索和工程化方案，分享算法效率优化、硬件资源限制下的算法探索的一些...

admin2年前

0160

正态检查相关算法

概念：正态检验，也被称为正态性检验，是一种统计方法，用于检验一个数据集是否符合正态分布。正态分布，也被称为高斯分布，是一种在自然和社会科学中常见的连续概率分布。正态性检验的重要性...

admin2年前

0340

如何攻击神经网络？人工智能VS人工智障

一、前言自2012年起，人工智能快速发展，频繁出现在大众视野。从Alpha GO到ChatGPT，人工智能已成为不可阻挡的发展趋势。但是由于神经学习的黑盒性质，导致神经网络难以解释，且难以控制。即使...

admin2年前

0110

算法套路三_二分查找——红蓝染色法

算法套路三:二分查找——红蓝染色法套路示例：LeetCode34. 在排序数组中查找元素的第一个和最后一个位置给你一个按照非递减顺序排列的整数数组 nums，和一个目标值 target。请你找出给定目标...

admin2年前

0170