计算机视觉
-
Python制作简易OCR文字识别系统
前不久看了一篇“如何使用Python检测和识别车牌?”用OpenCV对输入图像进行预处理,用imutils将原始输入图像裁剪成所需的大小,用pytesseract将提取车牌字符转换…
-
OCR项目实战(一):手写汉语拼音识别(Pytorch版)
??作者简介: 大数据专业硕士在读,CSDN人工智能领域博客专家,阿里云专家博主,专注大数据与人工智能知识分享。 ?专栏推荐: 目前在写一个CV方向专栏,后期会更新不限于目标检测…
-
激光点云系列之一:详解激光雷达点云数据的处理过程
交流群 | 进“传感器群/滑板底盘群”请加微信号:xsh041388 交流群 | 进“汽车基础软件群”请加微信号:Faye_chloe 备注信息:群名称 + 真实姓名、公司、岗位 …
-
RK3588 RGA 图像操作
背景 公司业务需要用到RK3588 的RGA进行图像处理加速,网上搜了下,这方面的资料很少,在此记录下自己从熟悉文档到应用的整个过程,给有相关需求的小伙伴做个参考。 一、什么是RG…
-
鲁棒性的含义以及如何提高模型的鲁棒性
1、含义 鲁棒是Robust的音译,也就是健壮和强壮的意思。它也是在异常和危险情况下系统生存的能力。比如说,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机、不…
-
yolov5改进之加入CBAM,SE,ECA,CA,SimAM,ShuffleAttention,Criss-CrossAttention,CrissCrossAttention多种注意力机制
本文所涉及到的yolov5网络为6.1版本(6.0-6.2均适用) yolov5加入注意力机制模块的三个标准步骤(适用于本文中的任何注意力机制) 1.common.py中加入注意力…
-
双目视觉目标追踪及三维坐标获取—python(代码)
2022年九月更新: 在原来的基础上,我使用了yolov5代替了opencv的目标检测算法辅助相机进行三维坐标的获取,并成功用获取的坐标实时控制机械臂,感兴趣的话可以看我b站里的视…
-
YOLO-V5轻松上手
之前介绍了YOLO-V1~V4版本各做了哪些事以及相较于之前版本的改进。有的人或许会想“直接学习最近版本的算法不好吗”,在我看来,每一个年代的版本/算法都凝聚着当年学术界的智慧,即…
-
基于深度学习的三维重建(一):三维重建简介、patchmatchNet环境部署、用colmap如何测试自己的数据集
目录 1.什么是三维重建 2.MVS是什么 3.传统MVS的局限性和为什么基于深度学习的MVS性能好于传统三维重建 4.基础概念 5. patchmatchNet环境配置 6.如何…
-
视频实时行为检测——基于yolov5+deepsort+slowfast算法
文章目录 前言 一、核心功能设计 二、核心实现步骤 1.yolov5实现目标检测 2.deepsort实现目标跟踪 3.slowfast动作识别 三、核心代码解析 1.参数 2.主…
-
python基于opencv和tkinter实现人脸识别【内附完整代码】
前言: 人脸识别技术已经在许多领域得到了广泛应用,例如安防、金融、医疗等等。人脸识别可以帮助我们识别和验证一个人的身份,这是一项非常重要的任务。本篇博客将介绍如何使用Python和…
-
【AI面试】目标检测中one-stage、two-stage算法的内容和优缺点对比汇总
在深度学习领域中,图像分类,目标检测和目标分割是三个相对来说较为基础的任务了。再加上图像生成(GAN,VAE,扩散模型),keypoints关键点检测等等,基本上涵盖了图像领域大部…
-
Python-OpenCV实现简单的颜色识别(对红色和蓝色识别并输出)
摄像头识别红色和蓝色并框选,当该颜色为摄像头屏幕上大多数颜色时打印出该颜色的名称 新手学习笔记,第一次写博客,若有错误还请指出( ~`_` )~ 1.调包 import cv2 i…
-
【YOLOv5问题记录】thop库的安装
最近开始学习YOLOv5,踩了不少坑,总结一下问题。 配置环境按照这篇教程来的:Yolov5的配置+训练(超级详细!!!)_小学生玩编程的博客-CSDN博客 训练数据集跟着炮哥的这…
-
Opencv实战案例——模板匹配实现银行卡号识别(附详细介绍及完整代码下载地址)
Opencv目录 1.项目意义 2.模板匹配 3.图像二值化 3.1全局阈值 3.2全局阈值代码即效果展示 3.3 自适应阈值 3.4自适应阈值代码即效果展示 4.轮廓筛选 4.1…
