音视频 - 小智博客

自动语音识别（ASR）技术详解

语音识别（Automatic Speech Recognition, ASR）是人工智能和自然语言处理领域的重要技术，旨在将人类的语音信号转换为对应的文本。近年来，深度学习的突破推动语音识别系统从实验室走入日常生活，为智能助手、实时翻译、医疗笔录等场景提供了核心支撑。本文将全面介绍ASR的工作原理、关键技术、应用场景、发展历程以

音视频 2025年07月09日 72 点赞 0 评论 13604 浏览

使用 DeepSeek 配合即梦AI 生成视频的详细教程

以下是使用 DeepSeek 配合即梦AI 生成视频的详细教程，结合了多篇搜索结果的实操经验与优化技巧，帮助用户高效完成从脚本设计到视频输出的全流程：一、生成视频脚本与分镜提示词启动DeepSeek的深度思考模式在DeepSeek官网或应用中，勾选“深度思考”功能，输入具体需求。例如： “我要制作一个关于普

音视频 2025年08月14日 159 点赞 0 评论 13582 浏览

CVAT完整实战教程：从零掌握计算机视觉数据标注

CVAT完整实战教程：从零掌握计算机视觉数据标注【免费下载链接】cvat Annotate better with CVAT, the industry-leading data engine for machine learning. Used and trusted by teams at any scale, for data of any scale. 项目地址:

音视频 2026年03月04日 88 点赞 0 评论 13565 浏览

企业微信自动发送图文、文件、音视频 Python 实现指南

🌈嘿，小伙伴们！在数字办公时代，企业微信已成为企业内部沟通的核心工具腾讯API可实现多种自动化操作，如：群发消息、图片、文件，精准@同事等本文将介绍如何用Python与企业微信群机器人通信，实现不同信息的推送与企业微信通信的逻辑：企微支持在内部群聊中添加机器人B

音视频 2025年08月29日 131 点赞 0 评论 13545 浏览

如何免费下载微信小程序视频（小白必会，超详细，100%成功，看完全文再动手做）

一、下载工具抓包工具 Fiddler： 可从 Telerik 官网免费下载 Fiddler Web 调试工具，链接为：Download Fiddler Web Debugging Tool for Free by Telerik

音视频 2025年04月16日 183 点赞 0 评论 13523 浏览

【arXiv2025】计算机视觉|即插即用|LWGA:即插即用！LWGA模块，视觉性能炸裂！

论文地址： 代码地址： CV缝合怪，分享最计算机视觉新即插即用模块，并提供配套的论文资料与代码。摘要遥感（RS&

音视频 2025年08月21日 193 点赞 0 评论 13482 浏览

FramePack：6G显存可生成2分钟长视频，附整合包

张吕敏最新开源的 FramePack 带来了颠覆性解决方案！作为一种下一代视频生成框架，通过智能压缩输入帧上下文，让视频扩散模型的计算瓶颈与视频长度 “脱钩”，即使在消费级显卡上也能用 13B 大模型生成 1 分钟高清视频（1800 帧仅需 6GB 显存）。在4090显卡上的生成速度约 2.5 秒/帧&#xff0

音视频 2025年08月14日 182 点赞 0 评论 13479 浏览

互联网大厂Java面试：从音视频场景到微服务与缓存技术的探索

互联网大厂Java面试：从音视频场景到微服务与缓存技术的探索面试场景在一家知名的互联网大厂，面试官严肃地坐在会议室中，准备开始对一位名叫谢飞机的程序员进行技术面试。今天的面试主题将围绕Java核心语言与平台、构建工具、Web框架、以及微服务与云原生等技术展开，特别是应用在音视频场景中的实践。第一轮提问：核心语言与平台面试官&#x

音视频 2025年08月26日 105 点赞 0 评论 13470 浏览

抖音爆款文案套路拆解 + HeyGem生成数字人解说视频

抖音爆款文案套路拆解 + HeyGem生成数字人解说视频在抖音日均播放量突破数百亿的今天，一条视频能不能“爆”，早已不再靠运气。那些看似轻松走红的知识博主、带货达人，背后往往有一整套工业化内容生产线在支撑——从文案结构到画面节奏，再到发布时机，每一步都经过精心设计。而其中最核心的一环：如何低成本、高频率地产

音视频 2026年03月04日 92 点赞 0 评论 13408 浏览

【机器学习】大模型环境下的应用：计算机视觉的探索与实践

 引言随着数据量的爆炸性增长和计算能力的提升，机器学习（Machine Learning，ML）在计算机视觉（Computer Vision，CV）领域的应用日益广泛。特别是大模型（Large Models）如深度卷积神经网络（CNN）的出现，极大地推动了图像识别、目标检测、图像生成等任务的性能和效果。本文将深入探讨机器学习与大模型在计算机视觉中的应用，结合代码示例，展示其在实际问题中的

音视频 2025年04月16日 96 点赞 0 评论 13278 浏览

音视频

首页

IT互联网

音视频

列表

默认

浏览次数

发布时间