音视频

【深度学习基础】一篇带你入门计算机视觉(从计算机视觉任务出发)

🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏: 🏀《AI认知筑基三十讲》_十二月的猫的博客-CSDN博客 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光  目录1. 前言2. 计算机视觉3. 十大基础任务3.1 图像分类3.2 带定位的

嵌入式linux学习之opencv交叉编译/移植并使用CmakeList编译demo

文章目录 一.交叉编译opencv库 1.下载opencv源码 2. 安装编译工具 3.安装opencv前安装环境依赖 处理图像所需的包 处理视频所需的包 优化opencv功能 4. 编译 问题汇总: 问题1: 问题2 问题3 问题4 问题5 问题6 二.cpp程序编写 1.CMakeList.tx

Android上使用无障碍服务(AccessibilityService)完成一键拨打微信视频电话

无障碍服务适配大家应该多多少少的都遇到过,简单点讲就是给图片、文本等控件加上 android:contentDescription=""标签,这样在使用无障碍服务(比如手机自带的 talkback)时,可以将contentDescription的内容以声音的方式读出来,方便视障用户使用我们的 app。这不是本文的重点&

利用DirectX和TCP技术实现音频采集、压缩、传输与回放的完整流程

本文还有配套的精品资源,点击获取 简介:音频处理技术在游戏开发、多媒体应用和实时通信中扮演着关键角色。本话题将探讨包括DirectX音频采集、MP3压缩、TCP网络传输和音频回放在内的完整实时音频流处理流程。DirectX提供高效音频数据捕捉和处理,MP3压缩技术Lame_Enc优化音频大小,TCP确保稳定的数据传输,

Java 大视界 -- Java 大数据在智能安防视频监控系统中的视频内容理解与智能预警升级(401)

Java 大视界 -- Java 大数据在智能安防视频监控系统中的视频内容理解与智能预警升级(401) 引言: 正文: 一、传统安防监控的 “三重困局”:看不全、看不懂、反应慢 1.1 人工盯屏 “力不从心” 1.1.1 摄像头密度与人力的矛盾 1.1.2 录像调阅 “马后炮”

DeepSeek视频生成广告短片自动合成高效工具

1. DeepSeek视频生成广告短片自动合成高效工具的技术背景与行业趋势 随着AIGC技术的突破性进展,广告内容生产正经历从“人工主导”到“AI驱动”的范式转移。传统视频制作依赖编剧、拍摄、剪辑等多环节协作,平均周期长达2–4周,成本高昂且难以规模化。而DeepSeek通过融合大规模语言模型与扩散生成网络,实现了基于自然语言指

23电赛e题复盘(舵机+opencv方案,附源码)

题目解读和大致思路 需要指导可以联系vx:xiaobai712356 1.激光点需能从任意位置回到原点 任务需求: 需知道激光点当前位置,原点位置, 控制激光点在白板上运动 解决方法: 1.识别激光点: 根据激光点所在像素点的亮度远远高于其他像素点,所以将图像转为[[HSV空间]] 而V表示亮

计算机视觉基础|轻量化网络设计:MobileNetV3

一、引言 在深度学习领域,随着移动端和嵌入式设备的快速发展,对神经网络模型的轻量化需求日益迫切。传统的卷积神经网络(CNN)虽然在性能上表现出色,但由于其参数量大、计算复杂,往往难以在资源受限的设备上高效运行。轻量化网络的出现,有效地解决了这一问题,使得深度学习模型能够在移动设备、物联

微信小程序视频上传功能深入解析与实践

本文还有配套的精品资源,点击获取 简介:在微信小程序开发中,上传视频组件是实现用户录制并分享视频的核心功能模块。本文详细介绍了实现该功能的关键技术点,包括使用wx.chooseVideo API实现视频的录制与选择,处理视频的临时存储与持久化,上传视频到服务器的过程,以及服务器端的视频处理。