音视频 - 小智博客

Web 音视频流媒体 API 全景

Web 音视频流媒体 API 全景目录概述渲染入口：<video> / <audio> 媒体源控制：MSE 实时通信：WebRTC 底层编解码：WebCodecs 音频处理：Web Audio API 手动渲染：Canvas / WebGL / WebGPU 传输层：W

音视频 2026年03月25日 149 点赞 0 评论 12259 浏览

【深度学习计算机视觉】10：转置卷积

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈PyTorch深度学习 ⌋

音视频 2025年10月24日 54 点赞 0 评论 12261 浏览

太香了!我用Claude Skills做了个会学习的剪辑Agent，10分钟自动剪视频!

太香了!我用Claude Skills做了个会学习的剪辑Agent，10分钟自动剪视频! 一、当剪辑师遇上"3个致命痛点"作为一名视频创作者，我每天面对3个世纪难题： 剪口播片太慢：30分钟的口播内容，手动剪辑要花2小时，还得自己找静音段和重复片段 AI机器听不懂人话：智能剪辑工

音视频 2026年03月07日 89 点赞 0 评论 12285 浏览

OpenCV深度解析：从基础到实战的计算机视觉库全指南

引言：OpenCV的诞生与影响力OpenCV（Open Source Computer Vision Library） 作为计算机视觉领域最具影响力的开源项目之一，自1999年由Intel发起以来，已发展成为连接理论研究与工业应用的核心桥梁。其模块化架构与跨平台特性支持Windows、Linux、macOS、Android等多

音视频 2025年08月24日 148 点赞 0 评论 12306 浏览

2024电赛H题参考方案（+视频演示＋核心控制代码）——自动行驶小车

目录一、题目要求二、参考资源获取三、TI板子可能用到的资源 1、环境搭建及工程移植 2、相关模块的移植四、控制参考方案 1、整体控制方案+视频演示 2、视频演示部分核心代码五、总结一、题目要求小编自认为：此次控制类类型题目的H题，相较于往年较为简单，功能也算单一

音视频 2025年05月18日 95 点赞 0 评论 12322 浏览

dify+wan2.1搭建文生视频生成工具流

本文介绍在dify中使用阿里开源的Wan2.1 1.3B模型搭建文生视频工作流的方法。使用的工具如下：1、dify（官方：

音视频 2025年06月27日 130 点赞 0 评论 12336 浏览

OpenCV DNN实战：年龄性别识别的模型剪枝技巧

OpenCV DNN实战：年龄性别识别的模型剪枝技巧1. AI 读脸术 - 年龄与性别识别在计算机视觉领域，人脸属性分析是一项极具实用价值的技术方向。从安防系统到智能营销，从个性化推荐到人机交互，自动识别人脸的性别与年龄段已成为许多AI应用的基础能力。传统的深度学习方案往往依赖PyTorch或TensorFlow等重型框架，部署

音视频 2026年03月31日 55 点赞 0 评论 12445 浏览

Coze实战：基于数据库的视频混剪工作流搭建（喂饭级教程）

作者：后端小肥肠 🍊 有疑问可私信或评论区联系我。 🥑 创作不易未经允许严禁转载。姊妹篇： Coze一键生成打字机效果书单视频（保姆级工作流拆解）-CSDN博客 Coze实战:《如果书籍会说话》保姆级教程！全流程拆解（附源码）-

音视频 2025年06月12日 200 点赞 0 评论 12451 浏览

SenSeVoice模型微调记录，语音识别垂直领域术语准确率提升至99%

场景：项目需要开发一个语音下单助手，但在识别能源石油领域的专业名词（如石油产品、仓库、炼油厂等）时准确率较低，导致无法正确匹配下单信息。需对语音识别模型进行微调，提升垂直领域术语的识别准确率。本文复现下之前微调的过程，以作记录。微调步骤一.准备数据集从数据库中查询出所有的商品名称，

音视频 2025年08月14日 93 点赞 0 评论 12472 浏览

Seedance 2.0（即梦 2.0）深度解析：AI 视频进入「导演级」可控时代

2026 年 2 月 12 日，字节跳动 Seed 实验室正式发布Seedance 2.0（即梦 2.0） 多模态音视频生成大模型。它以统一多模态联合架构为底座，在运动稳定性、角色一致性、多镜头叙事与音画同步上实现全面突破，成为当前国内最接近工业级生产的 AI 视频模型之一。一、核心定位与行业地位定位：全能型 A

音视频 2026年03月05日 79 点赞 0 评论 12567 浏览

音视频

首页

IT互联网

音视频

列表

默认

浏览次数

发布时间