Gold-yolo简介
Gold-YOLO模型是对YOLO(You Only Look Once)系列目标检测模型的一个改进版本,它主要解决了信息融合和特征提取方面的问题,以提高目标检测的准确性和效率。以下是Gold-YOLO模型的改进和详细思路: 信息聚集-分发(Gather-and-Distribute, GD)机制: 这是Gold-YOLO模型的核心改进。传统的YOLO模型使用FPN(Feature Pyramid Net...
【YoloDeployCsharp】基于.NET Framework的YOLO深度学习模型部署测试平台
YoloDeployCsharp|基于.NET Framework的YOLO深度学习模型部署测试平台 1. 项目介绍2. 支持模型3. 时间测试4. 总结 1. 项目介绍 基于.NET Framework 4.8 开发的深度学习模型部署测试平台,提供了YOLO框架的主流系列模型,包括YOLOv8~v9,以及其系列下的Det、Seg、Pose、Obb、Cls等应用场景,同时支持图像与视频检测。模型部署...
YOLO自研模块:多尺度轻量化卷积模块
目录 一、原理 二、代码 三、配置文件 一、原理 不同大小的卷积核,提取目标特征的特征尺度不同,所以通过使用不同大小卷积核的卷积来提取特征就可以保证获取到目标的多尺度特征。 借鉴YOLOv8中,将通道数进行划分的操作,在卷积的输入过程中为了减小参数量,将输入通道数一分为二,一部分保持不变,另一部分进行特征提取...
基于YOLOv5的道路裂缝检测,加入一种基于内容引导注意力(CGA)的混合融合提升2个多点
浙大 map从原始的0.952提升至0.977 博主简介 AI小怪兽,YOLO骨灰级玩家,1)YOLOv5、v7、v8优化创新,轻松涨点和模型轻量化;2)目标检测、语义分割、OCR、分类等技术孵化,赋能智能制造,工业项目落地经验丰富; 原创自研系列, 2024年计算机视觉顶会创...
YoloV8改进策略:上采样改进|动态上采样|轻量高效,即插即用(适用于分类、分割、检测等多种场景)
摘要 本文使用动态上采样改进YoloV8,动态上采样是今天最新的上采样改进方法,具有轻量高效的特点,经过验证,在多个场景上均有大幅度的涨点,而且改进方法简单,即插即用! 论文:《DySample:Learning to Upsample by Learning to Sample》 论文:https://arxiv.org/pdf/2308.15085 我们提出了DySample,一个超轻量级且高效的动...
计算机视觉——DiffYOLO 改进YOLO与扩散模型的抗噪声目标检测
概述 物体检测技术在图像处理和计算机视觉中发挥着重要作用。其中,YOLO 系列等型号因其高性能和高效率而备受关注。然而,在现实生活中,并非所有数据都是高质量的。在低质量数据集中,更难准确检测物体。为了解决这个问题,人们正在探索新的方法。例如,本文提出了一个名为 DiffYOLO 的框架。这可以提高低质量数据集上物体检测的准确性。 介绍 近年来,YOLO 被广泛应用于自动驾驶和医学图像处理等多个领域的物体...
YoloV5改进策略:下采样改进|自研下采样模块(独家改进)|疯狂涨点|附结构图
务的主干网络中,也可以用在分割和超分的任务中。已经有粉丝用来改进ConvNext模型,取得了非常好的效果,配合一些其他的改进,发一篇CVPR、ECCV之类的顶会完全没有问题。 本次我将这个模块用来改进YoloV5,实现大幅度涨点。 自研下采样模块及其变种 第一种改进方法 将输入分成两个分支,一个分支用卷积,一个分支分成两部分,一部分用MaxPool,一部分用AvgPool。然后,在最后合并起来。代码如下:...
YOLOv8改进 | 检测头篇 | 自研超分辨率检测头HATHead助力超分辨率检测(混合注意力变换器检测头)
些通道更重要,而自注意力则关注于图像内部各个位置之间的关系。HAT利用这两种注意力机制,有效地整合了全局的像素信息。本文中均有添加方法和原理解析,本文内容为我独家创新。 欢迎大家订阅我的专栏一起学习YOLO! ...
YOLOv9改进策略 :红外小目标 | 注意力 |多膨胀通道精炼(MDCR)模块,红外小目标暴力涨点| 2024年3月最新成果
💡💡💡红外小目标实现暴力涨点,只有几个像素的小目标识别率大幅度提升 💡💡💡多个私有数据集涨点明显,如缺陷检测NEU-DET、农业病害检测等; 改进1结构图如下: 改进2结构图如下: 《YOLOv9魔术师专栏》将从以下各个方向进行创新: 【原创自研模块】【多组合点优化...
改进YOLO系列 | EfficientViT:用于高分辨率密集预测的多尺度线性注意力 | ICCV 2023
高分辨率密集预测使许多吸引人的现实世界应用成为可能,例如计算摄影、自动驾驶等。然而,庞大的计算成本使得在硬件设备上部署最先进的高分辨率密集预测模型变得困难。本文介绍了EfficientViT,一种新的高分辨率视觉模型系列,具有新颖的多尺度线性注意力。与依赖于重型 softmax 注意力、硬件效率低下的大核卷积或复杂的拓扑结构以获得良好性能的先前高分辨率密集预测模型不同,我们的多尺度线性注意力仅通过轻量级...