基于Mediapipe的摄像头手势识别

下载地址

由于此项目包含调用多个类库和文件,所以仅提供GitHub下载地址:

https://github.com/dbgba/VisualGestureRecognition

国内GitHub镜像源地址:

https://hub.fastgit.xyz/dbgba/VisualGestureRecognition

点击 “Code” 里的,”Download ZIP”即可下载源代码包

项目简介

  • 基于AutoHotkey制作的摄像头手势识别软件。能让你的电脑摄像头在识别手势后,执行自定义的电脑操作命令。同时也集成了语音识别功能,可调用Windows自带API实现简单的语音助手功能。

  • 手势识别调用了高性能的Mediapipe动态链接库来免部署实现。而电脑自动化操作使用AutoHotkey脚本语言来实现,它能更方便的对电脑进行深度调用和流程自动化处理。

使用介绍

  • 测试环境:Win10 64位(专业版完整镜像)

  • 第一次运行 Visual_Gesture_Recognition.exe时,会提示下载手势识别的依赖包。点击确定后,跟着提示点击自动下载

  基于Mediapipe的摄像头手势识别

  • 等待下载完成后,软件会自动解压适配手势识别功能。

  基于Mediapipe的摄像头手势识别

  • 之后就可以对你的摄像头进行手势识别控制了。下图示例为:当双手抬起竖起大拇指时,就执行打开网页并放大网页

  基于Mediapipe的摄像头手势识别

  • 软件还附带了调用Windows自带API来实现的免费语音助手。下图示例为:说出电子电子唤醒语音识别后,再说出关键字启动游戏大厅即可执行对应的自定义流程

  基于Mediapipe的摄像头手势识别

  • 更多玩法和用法,请详见设置帮助的具体说明。例如:当摄像头中有人时,自动切换到虚拟桌面。 想创造更多自动化玩法组合,可使用软件附带的生成快捷代码AHK中文帮助文档来实现自己的定制需求

注意事项

  • 此exe文件为AutoHotkey开源项目,请将其加入杀毒-信任区。避免不必要的麻烦。

  • 手势识别需要借助电脑的摄像头实现(任意摄像头都行),而语音识别需要接电脑麦克风实现。由于语音识别是调用Windows自带API来实现的,有些系统为了缩减体积会删掉此语音识别播报API导致无效。用原版镜像上安装的系统基本都不会出这问题。

  • 我添加了4个手势依赖包的镜像源供高速下载,如果出现某个镜像源无法下载的情况。可根据弹出提示点击重新换源下载即可。如果镜像源和官方源自动下载都失效,只能自行想办法从官方GitHub下载”GoogleMediapipePackageDll-main.zip”压缩包后,将压缩包存放在”Lib”目录中,重启软件即可识别压缩包并解压适配手势识别功能。

感谢以下项目

peng-zhihui/ElectronBot: Open Source Desktop Robotics Project

Lexikos/AutoHotkey_L: AutoHotkey – macro-creation and automation-oriented scripting utility for Windows. (github.com)

HW140701/GoogleMediapipePackageDll: package google mediapipe hand and holistic tracking into a dynamic link library

给TA捐赠
共{{data.count}}人
人已捐赠
其他

调用系统API异步播放MP3音乐

2022-8-12 20:47:06

其他

; 全自动静默安装 FastCopy ver 4.2.0 简体中文汉化版-2022年8月12日

2022-8-13 16:28:28

7 条回复 A文章作者 M管理员
  1. AHK中文社区
    1河许人给您打赏了¥20
  2. ahk小明

    软件非常厉害,但是试了多次一直无法调用摄像头,不知道是什么原因

    • dbgba

      摄像头能不能被电脑正常读取?设置界面里有选择调用第几个摄像头

  3. a715013196

    我想在语音应答之后 电脑直接发送按键 Send, {F10} , 我应该加在什么地方,搞了好久没弄明白。

    • a715013196

      F10我设置了 启动其他语音的脚本。想实现的效果,我唤醒+电脑应答之后同时发送按键启动语音-然后实现操作对语音唤醒操作

  4. a715013196

    还有就是我这个模拟小爱同学唤醒的代码,能直接添加到软件例程里么,我直接复制里边报错呢 —– 在桌面 CTRL+SHIFT+A 打开小爱同学语音 —– F10:: { if (!WinExist(“小爱同学”)) { ; 未启动,启动小爱并等待页面初始化完成 Run “Xiaoai.lnk”, “C:UsersmajianguoDesktop” aid := WinWait(“小爱同学”, “小爱同学”, 5) } WinActivate ; 将小爱窗口激活 Sleep 200 ; 不加这个延时不太稳定 WinGetPos , , &W, &H, “” MouseGetPos &xpos, &ypos Click “37 ” . (H – 37) Click xpos . ” ” . ypos . ” 0″ }

    • a715013196

      点击添加语音识别到是能运行代码

个人中心
购物车
优惠劵
有新私信 私信列表
搜索