6 篇文章 最后更新:2025年6月6日
YOLOv8

yolo快速入门

yolov8仓库地址:https://github.com/ultralytics/ultralytics

yolov8官方文档:https://docs.ultralytics.com

yolov8的安装

使用yolov8需要 python>=3.8 和 PyTorch>=1.8 的环境,参照:Python常用环境的安装

Pip install the ultralytics package including all requirements in a Python>=3.8 environment with PyTorch>=1.8.

bash
conda create --name yolov8 --clone pytorch
conda activate yolov8

pip install ultralytics

YOLOv8 may be used directly in the Command Line Interface (CLI) with a yolo command:

阅读更多 »
Stable diffusion

Webui的安装

windows下Anaconda环境安装stable-diffusion-webui

相关工具的准备

所需工具:git, anaconda, pytorch环境

相关内容参照:Python常用环境的安装

下载源码

准备好环境后就可以拉代码了:

bash
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

依赖库安装

可以创建/克隆一个新环境 sdw 出来操作:

bash
conda create --name sdw --clone pytorch
conda activate sdw

# 进入 stable-diffusion-webui 目录安装项目依赖包
pip3 install -r requirements.txt 

修改启动脚本

使用conda就不需要stable-diffusion-webui自己去安装venv虚拟环境了,可以通过修改webui-user.bat实现:

阅读更多 »
HID设备及USB

HID(Human Interface Device)是计算机与人类交互的接口设备的标准,如键盘、鼠标、游戏控制器等。HID标准由USB规范定义,旨在为这些设备提供一种统一且易于实现的方式进行通信。HID协议不仅限于USB设备,也可以通过蓝牙等其他传输方式工作。


HID—键鼠工作原理

键盘工作原理

以 Windows 系统下 USB HID 设备为例:


1️⃣ 键盘基础工作原理

✅ 键盘做的事:

  • 通过扫描键盘矩阵,检测哪个按键被按下;
  • 转换为 HID 报文格式;
  • 等待主机通过 USB IN 请求轮询,再将 HID 报文响应给主机。

✅ HID 报文内容(8字节):

bash
[Modifier][Reserved][Key1][Key2][Key3][Key4][Key5][Key6]
  • 同一时间最多报告 6 个按键(不包括修饰键);
  • 修饰键(Ctrl、Alt、Shift等)在第一个字节中以位表示;
  • 报文表示"当前所有被按下的键"。

2️⃣ 报文何时发送?

✅ 键盘本身不会"主动发送"报文,而是主机持续发送 IN 请求,键盘在被轮询到时返回状态数据:

阅读更多 »
PICO RP2040

🍓Raspberry Pi Pico 简介 参照 Pico中文站:https://pico.org.cn/

英文文档地址:https://datasheets.raspberrypi.com/pico/getting-started-with-pico.pdf

🍓Raspberry Pi Pico

  • Thonny (经典开发方式,之前官方主推的方式,性能略差)
  • VS code : 性能强,速度快,配置简单,但是资料较少

树莓派 Pico C SDK 入门:https://geekdaxue.co/read/jacky-qa5zo@vgqebl/gmn6zsgy9cmznxbf

Thonny开发方式

🧰 所需工具

工具 用途 下载地址/说明
CMake 项目构建系统 CMake
GNU Arm Toolchain 编译 ARM Cortex-M0+ 代码 ARM GCC compiler
Pico SDK RP2040 官方开发包 pico-sdk github
Thonny / UF2 拖拽 / OpenOCD 烧录工具 拖动 .uf2 文件最简单

环境变量:PICO_SDK_PATH 指向本地SDK路径(例如/home/pi/pico/pico-sdk或Windows的D:\RP2040\pico-sdk)

更多经典开发方式的内容参照:https://github.com/mobyw/pico-getting-started


VS code 插件

VSCode的Raspberry Pi Pico插件支持一键创建项目并自动配置工具链(包括CMake和pico-sdk)。

阅读更多 »
CH9329

CH9329设备

CH9329 芯片是由沁恒生产的一种串口转HID键盘鼠标芯片。它可以将上位机发送的串口数据转换为标准的USB键鼠设备信号,并将其发送给下位机,从而实现硬件级别的键鼠模拟。

官网信息:

https://special.wch.cn/zh_cn/USBChips/#/

https://www.wch.cn/products/CH9329.html

CH9329文档地址:https://www.wch.cn/uploads/file/20190508/1557278355473027.pdf

Github参考:https://github.com/beijixiaohu/CH9329_COMM

bash
pip install ch9329Comm -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install pyserial  -i https://pypi.tuna.tsinghua.edu.cn/simple 
pip install pyautogui -i https://pypi.tuna.tsinghua.edu.cn/simple

串口通信详解

阅读更多 »
Carrying bricks

一 项目环境准备

1. 训练环境准备

基本环境要求:Anaconda的Python开发环境、N卡及相关机器学习相关软件

2. 使用环境搭建

不同于训练环境,使用环境不需要 cuda 相关的包, 操作前先配置好 conda 源,下载会更快

bash
conda create -n yolov8 python=3.10
conda activate yolov8

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

pip uninstall opencv_python
pip install opencv-contrib-python

修改好角色配置文件,启动Main.py即可

二 图像处理及目标检测

1. 获取窗口截图

刚开始我们需要先获取供训练AI所需的图片,这里需要使用一些Python的第三方库: pywin32, numpy, opencv-python

阅读更多 »