音视频 - 小智博客

从零搭建中文语音识别服务｜基于FunASR镜像实现文件转写与实时录音识别

从零搭建中文语音识别服务｜基于FunASR镜像实现文件转写与实时录音识别1. 引言1.1 业务场景描述在智能客服、会议记录、教育录播和内容创作等场景中，将语音高效准确地转换为文字是一项核心需求。传统的语音识别方案往往依赖云端API，存在数据隐私风险、网络延迟高以及调用成本高等问题。本地化部署的语音识别系统成为越来越多企业与开发者的首选。1.2 痛点分析目前

音视频 2026年01月23日 67 点赞 0 评论 6112 浏览

实战：用OpenCV和Python进行人脸识别

SQLAlchemy是Python中最流行的ORM（对象关系映射）框架之一，它提供了高效且灵活的数据库操作方式。本文将介绍如何使用SQLAlchemy ORM进行数据库操作。目录安装SQLAlchemy 核心概念连接数据库定义数据模型创建数据库表基本CRUD操作查询数据关系操作

音视频 2026年02月14日 141 点赞 0 评论 6101 浏览

Wondershare Repairit：专业的视频修复工具

Wondershare Repairit 是一款功能强大的专业视频修复软件，能够有效修复各种视频文件中的损坏、丢失、花屏、马赛克等问题，帮助用户恢复视频的正常播放状态。它支持多种视频格式，包括 MP4、MOV、AVI、FLV、MKV 等，广泛应用于各种场景，如视频编辑、视频拍摄、视频存储等。核心功能1. 修复损坏的视频文件Won

音视频 2025年09月06日 170 点赞 0 评论 6078 浏览

OpenCV与AI深度学习 | MobileCLIP：一种轻量级的零样本图像分类解决方案（介绍 + 代码演示）

本文来源公众号“OpenCV与AI深度学习”，仅用于学术分享，侵权删，干货满满。原文链接：MobileCLIP：一种轻量级的零样本图像分类解决方案（介绍 + 代码演示）介绍在当今快速发展的计算机视觉领域，人们越来越需要能够快速高效地适应新情况的技术。该领域最令人兴奋的发展

音视频 2025年10月03日 105 点赞 0 评论 6053 浏览

Video Duplicate Finder 快速识别并去除重复的视频和图像！

文章目录下载后续升级 Video Duplicate Finder（视频重复查找器）是一款开源的跨平台视频（以及图像）去重软件，通过对比文件内容和特征，快速识别出重复的视频和图像文件，即使是被压缩裁剪过、不同分辨率、帧率、格式或带有水印的文件也能轻松找出。特点： 跨平台扫描

音视频 2025年09月07日 75 点赞 0 评论 6032 浏览

【红黑树进阶】手撕STL源码：从零封装RB-tree实现map和set

👇点击进入作者专栏：《算法画解》 ✅ 《linux系统编程》✅《C++》 ✅ 文章目录一. 源码及框架分析 1.1 STL源码中的设计思想 1.2 STL源码框架分析二. 模拟实现map和set（实现复用红黑树的框架） 2.1 红黑树节点的定义 2.2 红黑树的基本框架 2.3 解决Key

音视频 2026年03月10日 151 点赞 0 评论 6017 浏览

ESP32-S3经典蓝牙A2DP音频输出

ESP32-S3蓝牙A2DP音频系统深度解析与实战优化你有没有遇到过这种情况：手里的蓝牙音箱连上了手机，音乐一响——“咔！噗噗噗……”然后声音断断续续，像是被掐住脖子的鸭子？😅 这可不是什么玄学问题，而是背后有一整套复杂的协议、硬件协同和实时调度在默默工作。今天我们就来揭开ESP32-S3平

音视频 2026年04月13日 108 点赞 0 评论 6006 浏览

机器学习&计算机视觉：带你了解机器学习、深度学习、计算机视觉、机器视觉的前世今生

目录一、什么是机器学习？1.1 机器学习的概念1.2 三大学习范式1.3 经典算法1.4 机器学习工作流程二、深度学习革命2.1 深度学习的崛起2.2 神经网络基础三、计算机视觉&机器视觉3.1 计算机视觉3.2 机器视觉3.3 核心辨析3.4 核心任务3.5 技术栈演进四、总结一、什么是机器学习？1.1 机器学习的概念机器学习是人工智能的一个分支&#xff0c

音视频 2026年01月09日 184 点赞 0 评论 5972 浏览

realtek高清晰音频管理器下载及安装教程（含五种方法）

很多用户在使用电脑时会遇到声音异常、音频设备无法识别或缺少音效调节功能等问题，这通常与Realtek高清晰音频管理器缺失或驱动异常有关。作为常见的音频控制工具，正确下载并安装Realtek高清晰音频管理器非常关键。下面为大家整理了几种实用方法，帮助你快速完成下载与安装。一、通过官网下载安装Realtek音频驱动通过官网获取驱动程序安全可靠，

音视频 2026年04月09日 43 点赞 0 评论 5931 浏览

【深度学习计算机视觉】07：单发多框检测（SSD）

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈PyTorch深度学习 ⌋

音视频 2025年10月06日 132 点赞 0 评论 5923 浏览

音视频

首页

IT互联网

音视频

列表

默认

浏览次数

发布时间