音视频

OpenCV 图形API(27)图像滤波-----膨胀函数dilate()

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C++11 算法描述使用特定的结构元素膨胀图像。 cv::gapi::dilate 是 OpenCV G-API 模块中的一个函数,用于对图像执行膨胀操作。膨胀是一种形态学操作&#xff0

探索元生代:ComfyUI 工作流与计算机视觉的奇妙邂逅

目录一、引言二、蓝耘元生代和 ComfyUI 工作流初印象(一)蓝耘元生代平台简介(二)ComfyUI 工作流创建是啥玩意儿三、计算机视觉是个啥(一)计算机视觉的基本概念(二)计算机视觉的应用场景四、蓝耘元生代平台上的 ComfyUI 工作流与计算机视觉的联系(一&#xff

ESP32的I2S引脚及支持的音频标准使用说明

ESP32 I2S 接口ESP32 有 2 个标准 I2S 接口。这 2 个接口可以以主机或从机模式,在全双工或半双工模式下工作,并且可被配置为 8/16/32/48/64-bit 的输入输出通道,支持频率从 10 kHz 到 40 MHz 的 BCK 时钟。当 1 个或 2 个 被配置为主机模式时,主机时钟可以输出到外部 DAC/CODEC。2 个 I2S 接口都有专用的 DMA 控制器。支持

抖音无水印视频在线解析工具(2025年最新教程)

2025年,短视频依然是互联网内容的主流形式,而抖音作为全球领先的短视频平台,吸引了无数创作者和用户。然而,下载抖音视频时,水印问题一直让人头疼。今天,我们将手把手教您如何使用V2OB在线工具,轻松下载高清无水印的抖音视频。第一步:访问V2OB官网打开浏览器,输入V2OB官

LatentSync本地部署教程:一键生成逼真唇形同步视频!

LatentSync是由字节跳动联合北京交通大学开源的一种唇形同步框架。​LatentSync基于音频条件构建的潜在扩散模型摒弃了传统方式中必备的中间3D表示以及2D特征点。凭借Stable Diffusion所赋予的超强 “创作力”,它能够敏锐地捕捉到那些错综复杂的视听关联,将无形的音频精准转化为动态鲜活、逼真度极高的说话视频。核心技术:音频条件潜在扩散

CogVideoX - Fun:以 CogVideoX 框架为基,开启无限长 AI 视频生成新时代

目录 引言 一、CogVideoX-Fun简介 二、功能特点 三、技术原理 四、应用场景 结语 引言在人工智能的浪潮中,AI视频生成技术正逐渐成为内容创作的新宠。其中,CogVideoX-Fun作为一款基于CogVideoX的整合包,不仅支持从文字到视频的生成,还拓展了视频分辨率的界限,为创作者提供了更广阔的创

OpenCV与AI深度学习|16个含源码和数据集的计算机视觉实战项目(建议收藏!)

本文来源公众号“OpenCV与AI深度学习”,仅用于学术分享,侵权删,干货满满。原文链接:分享|16个含源码和数据集的计算机视觉实战项目本文将分享16个含源码和数据集的计算机视觉实战项目。具体包括:    1. 人数统计工具    2. 颜色检测    3. 视频中的对象跟踪    4. 行人检测    5. 手势