音视频

C# 基于OpenCv的视觉工作流-章27-图像分割

C# 基于OpenCv的视觉工作流-章27-图像分割本章目标: 一、理论概念; 二、图像处理; 三、设置背景图; 四、设置前景图; 五、计算边缘图; 六、构建标识图; 七、图像分割; 一、理论概念; 详细见文末链接 二、图像处理; 对图像进行转灰度图、

HG-ha/MTools效果展示:AI音视频编辑模块对老旧VHS录像带的智能修复成果

HG-ha/MTools效果展示:AI音视频编辑模块对老旧VHS录像带的智能修复成果1. 开箱即用:第一眼就让人想点开试试你有没有翻出过家里抽屉深处那盘泛黄的VHS录像带?画面抖动、色彩发灰、声音嘶哑,像被时间蒙上了一层毛玻璃。过去想修复它,得找专业设备、花大价钱,还未必能还原当年的温度。而今天,HG

Flutter 三方库 dartcv4 的鸿蒙化适配指南 - 让 OpenCV 极速视觉处理能力全面灌注鸿蒙生态

欢迎加入开源鸿蒙跨平台社区:#Flutter 三方库 dartcv4 的鸿蒙化适配指南 - 让 OpenCV 极速视觉处理能力全面灌注鸿蒙生态在鸿蒙(OpenHarmony)系统的工业视觉、车载监控及智能识图等尖端领域,如何高效调用 OpenCV 的核心算法?dartcv4 作为一个基于 dart:ffi 的 OpenCV 4

语音识别十年演进

语音识别(Automatic Speech Recognition, ASR) 的十年(2015–2025),是从“复杂的混合专家系统”向“端到端全神经网络”,再到“跨模态原生感知与内核级低延迟实时处理”的演进。这十年中,语音识别完成了从**“听清字句”到“听懂意图”,再到由 eBPF

AI视频生成实战:用扣子SKILL一键制作产品宣传片(Seedance 2.0开年最强教程)

引言:当AI视频生成进入2.0时代如果你还在为制作产品宣传片而头疼——找编剧、租设备、请演员、后期剪辑,整个流程耗时费力,成本动不动就数万元——那么今天这篇文章会彻底改变你的认知。2026年开年最震撼的技术事件是什么? 毫无疑问是字节跳动Seedance 2.0的横空出世!这款被誉为“地表最强视频生成模型”的AI工具&#xff0

太香了!我用Claude Skills做了个会学习的剪辑Agent,10分钟自动剪视频!

太香了!我用Claude Skills做了个会学习的剪辑Agent,10分钟自动剪视频! 一、当剪辑师遇上"3个致命痛点"作为一名视频创作者,我每天面对3个世纪难题: 剪口播片太慢:30分钟的口播内容,手动剪辑要花2小时,还得自己找静音段和重复片段 AI机器听不懂人话:智能剪辑工

【SAM2系列01】SAM2概述——从图像分割到视频分割的飞跃

【SAM2系列01】SAM2概述——从图像分割到视频分割的飞跃 本文是SAM2系列博客的第一篇,介绍SAM2(Segment Anything Model 2)的诞生背景、核心改进、与SAM的对比分析,以及其在视频分割领域的突破性贡献。 1. 引言2024年7月,Meta AI发布了Segment Anything Mode

Whisper-large-v3从零开始:非AI工程师也能30分钟搭好语音识别服务

Whisper-large-v3从零开始:非AI工程师也能30分钟搭好语音识别服务 作者:by113小贝 | 10年+AI工程实践经验 1. 开篇:为什么你需要这个语音识别服务你是不是遇到过这些情况: 会议录音需要整理成文字,手动打字要花好几个小时 外语视频想了解内容,但听不懂也找不到字幕 采访录音需