音视频 - 小智博客

【AIGC前沿】MiniMax海螺AI视频——图片/文本生成高质量视频

目录1.MiniMax海螺AI视频简介2.使用教程1.MiniMax海螺AI视频简介海螺视频，作为 MiniMax 旗下海螺 AI 平台精心打造的 AI 视频生成工具，致力于助力用户产出高品质视频内容。该工具依托 abab-video-1 模型，具备强大的文生视频功能。用户仅需输入关键词或简短语句，海螺视频就能据此创作出情节丰富的完整视频。此

音视频 2025年04月21日 61 点赞 0 评论 5920 浏览

从安装到实战：Fun-ASR-MLT-Nano-2512语音识别全流程

从安装到实战：Fun-ASR-MLT-Nano-2512语音识别全流程你是否经历过这样的场景：会议录音存了上百条，却始终没时间整理；客服电话里客户反复强调“我的订单号是A20240317-8892”，转写结果却变成“A20240317-BB92”；又或者，一段粤语访谈音频上传到公有云API后&#xff

音视频 2026年03月08日 120 点赞 0 评论 5879 浏览

深度学习计算机视觉实战：从原理到应用

深度学习计算机视觉实战：从原理到应用1. 背景与动机计算机视觉是深度学习最成功的应用领域之一，从图像分类到目标检测、语义分割，深度学习模型在各项任务中都取得了突破性进展。2. 核心任务2.1 图像分类import torch import torch.nn as nn from torchvision import models # 使用预训练 ResN

音视频 2026年04月13日 147 点赞 0 评论 5806 浏览

计算机视觉基础｜轻量化网络设计：MobileNetV3

一、引言在深度学习领域，随着移动端和嵌入式设备的快速发展，对神经网络模型的轻量化需求日益迫切。传统的卷积神经网络（CNN）虽然在性能上表现出色，但由于其参数量大、计算复杂，往往难以在资源受限的设备上高效运行。轻量化网络的出现，有效地解决了这一问题，使得深度学习模型能够在移动设备、物联

音视频 2025年05月15日 99 点赞 0 评论 5776 浏览

手把手教你用TurboDiffusion搭建个人AI视频生成系统

手把手教你用TurboDiffusion搭建个人AI视频生成系统你是不是也想过：不用专业剪辑软件、不学复杂动画原理，只靠几句话或一张图，就能让想法秒变动态视频？不是概念演示，不是实验室demo，而是真正在你自己的显卡上跑起来、点几下就能出片的视频生成系统。TurboDiffusion就是这样一个“把科幻变成日常工具

音视频 2026年02月16日 51 点赞 0 评论 5699 浏览

【人人有份，算力自由】CSDN星图“算力推荐官”全民招募！

各位开发者、创作者、技术探索者们，CSDN现推出星图“算力推荐官”全民招募活动。 “全民热推，速领算力” 社交平台推广激励计划。无需粉丝门槛，无论你是技术大神还是AI新手，只要愿意分享，就能轻松获得CSDN算力，助你在AI创作与学习的道路上走得更远。一、活动说明参与对象 CSDN站内所有注册用户（无

音视频 2026年03月02日 58 点赞 0 评论 5697 浏览

微信小程序视频上传功能深入解析与实践

本文还有配套的精品资源，点击获取简介：在微信小程序开发中，上传视频组件是实现用户录制并分享视频的核心功能模块。本文详细介绍了实现该功能的关键技术点，包括使用wx.chooseVideo API实现视频的录制与选择，处理视频的临时存储与持久化，上传视频到服务器的过程，以及服务器端的视频处理。

音视频 2025年09月07日 79 点赞 0 评论 5694 浏览

阿里开源 Wan2.2：视频生成迈入电影级时代，部署教程全解析

0.前言阿里巴巴于2025年7月28日正式开源了Wan2.2 作为阿里云推出的升级版视频生成模型，凭借其先进的技术架构、开源特性以及丰富的功能，为视频生成领域带来了新的可能性。随着技术的不断进步，Wan2.2 将在短剧、广告、电影等多个领域发挥重要作用，推动整个行业向前发展一张图给大家展示下面详细给大家介绍一下它的技术和能力亮点。 1.核心

音视频 2025年08月24日 92 点赞 0 评论 5680 浏览

B站字幕提取神器：3步搞定视频字幕本地化

还在为B站视频无法保存字幕而烦恼吗？想要离线学习外语课程却苦于没有字幕文件？今天要介绍的这款工具将彻底改变你的视频学习体验。BiliBiliCCSubtitle作为一款专业的字幕提取工具，能够轻松将B站的CC字幕转换为通用格式，让你的学习更加高效便捷。【免费下载链接】BiliBiliCCSubtitle 一个用于下载B站(哔哩哔哩)CC

音视频 2026年01月23日 165 点赞 0 评论 5676 浏览

Flutter 三方库 fft 的鸿蒙化适配指南 - 实现端侧高性能快速傅里叶变换、支持音频频谱分析与信号处理域的频域特征提取实战

欢迎加入开源鸿蒙跨平台社区：#Flutter 三方库 fft 的鸿蒙化适配指南 - 实现端侧高性能快速傅里叶变换、支持音频频谱分析与信号处理域的频域特征提取实战前言在进行 Flutter for OpenHarmony 的音频可视化、语音识别前置预处理或振动传感器信号分析应用开发时，将信号从“时域（Time Domain）”转换到“频域&#x

音视频 2026年03月30日 150 点赞 0 评论 5574 浏览

音视频

首页

IT互联网

音视频

列表

默认

浏览次数

发布时间