TechBlog
首页分类标签搜索关于
← 返回标签列表
加载中...

© 2025 TechBlog. All rights reserved.

#标签

共 531 篇文章
使用AI一步生成音视频文件的会议纪要或者课后笔记

使用AI一步生成音视频文件的会议纪要或者课后笔记

本文介绍了一种使用AI自动生成音视频文件会议纪要或课后笔记的方法。流程包括:1)使用ffmpeg提取16KHz单声道音频;2)通过ASR实时识别生成文本;3)利用大语言模型分段摘要并输出Markdown或者pdf格式纪要。

时间:12/21/2025

音视频学习七十五视频压缩量化

音视频学习七十五视频压缩量化

量化(Quantization)是指:将连续值或高精度离散值映射为有限个低精度值的过程DCT/整数变换后的变换系数量化的数学形式一般为:X:原始变换系数Δ:量化步长Q:量化后的整数值反量化时:由于round操作,反量化无法恢复原始精度,这是信息损失的根源。量化是视频压缩中最核心、最关键、也是最复杂的技术之一它是唯一引入不可逆失真的环节决定了画质与码率的根本平衡与人眼感知、码率控制、编码效率紧密相关预测决定“差多少”,变换决定“怎么表示”,量化决定“丢多少”

时间:12/20/2025

Flutter-视频播放全攻略video_player-2.10.1-插件全平台集成与实战

Flutter-视频播放全攻略video_player-2.10.1-插件全平台集成与实战

本文全面介绍了Flutter官方视频播放插件video_player2.10.1的使用方法,主要内容包括:1.插件特性:支持iOS/Android/macOS/Web四大平台,提供统一API封装,支持网络/本地/资产视频播放,具备完整播放控制功能。2.环境配置:详细说明了各平台的前置权限配置要求,包括iOS的ATS配置、Android的网络权限等。3.功能实现:通过代码示例演示了网络视频、本地资产视频和文件视频的播放实现方法。4.进阶功能:介绍了播放速度调节、视图类型切换等高级功能的使用方式。5.

时间:12/20/2025

Android-音视频实战基于SmartMediakit实现RTSPRTMP高性能透传二次编码与动态水印

Android-音视频实战基于SmartMediakit实现RTSPRTMP高性能透传二次编码与动态水印

本文深入探讨Android端音视频开发的架构抉择难题:如何在一套系统中兼顾极致低延迟(如无人机图传)与丰富业务处理(如动态水印、AI分析)。基于大牛直播SDK(SmartPlayer+SmartPublisher),文章详细解析了如何利用Wrapper封装模式与事件驱动机制,灵活切换“透传”与“转码”两种核心模式。最终展示了如何构建一个集RTSP/RTMP拉流、RTMP转推、本地录像及轻量级RTSP服务于一体的高性能全能终端,为安防监控与应急指挥等复杂场景提供工业级解决方案。

时间:12/19/2025

H5页面中实现自定义视频播放器

H5页面中实现自定义视频播放器

本文介绍了在H5页面中实现自定义视频播放器的React组件方案。通过使用video标签和自定义控制逻辑,实现了播放/暂停功能、进度条拖动、时间显示等核心播放器功能。重点解决了移动端兼容性问题,包括iOSSafari内联播放、微信/QQ浏览器X5内核适配、自动播放限制处理等。组件通过useRef获取video元素,利用useState管理播放状态、进度和时间,并提供了完整的播放控制交互逻辑。代码中还包含错误处理和AirPlay支持等细节优化,为移动端视频播放提供了完整的实现参考。

时间:12/18/2025

Android-车机高通蓝牙电话-音频收发流程

Android-车机高通蓝牙电话-音频收发流程

这个完整的音频收发流程涵盖了从蓝牙协议栈到音频HAL,再到DSP处理和车机特定优化的所有环节。

时间:12/17/2025

开源的音视频元数据分析工具

开源的音视频元数据分析工具

MediaInfo的核心优势是“轻量、免费、跨平台、基础参数全面”,适合大多数用户的日常需求;但在“元数据修改、深度码流分析、专业生产参数”等场景,需搭配其他工具使用。选择时可遵循“基础需求用MediaInfo,专项需求用补充工具,专业需求用生产级软件”的原则,通过工具组合覆盖从“日常查看”到“研发测试”再到“专业生产”的全场景需求。

时间:12/16/2025

蓝牙模块全品类解决方案低功耗数传音频模块赋能物联网创新

蓝牙模块全品类解决方案低功耗数传音频模块赋能物联网创新

作为无线连接的核心组件,正经历从单一功能向多元化、高性能的升级。本文汇总全品类蓝牙模块(包括低功耗BLE、数传模块、LEAudio音频模块、双模模块等),覆盖医疗监护、智能家居、工业物联等场景,提供从选型到落地的技术指南。,从LEAudio音频到双模融合,全品类蓝牙模块正在为物联网设备注入更灵活、高效的连接能力。通过精准选型与定制开发,企业可快速落地。随着物联网(IoT)设备的爆发式增长,等创新应用,抢占智能化赛道先机。

时间:12/16/2025

腾讯云游戏音视频方案如何助力初创公司提升用户粘性

腾讯云游戏音视频方案如何助力初创公司提升用户粘性

腾讯云游戏音视频方案通过技术优势(低延迟、AI降噪)、社交强化(语音互动、社区建设)、成本优化(免费额度、按需付费)三大维度,帮助初创公司构建高粘性的游戏社交生态,有效提升用户留存率和活跃度。

时间:12/16/2025

适配小程序的下滑上滑播放视频组件

适配小程序的下滑上滑播放视频组件

随着时间流失,我的故事很多,当时人生很短,有一天需要开发一个视频组件,公司的测试妹妹说,我之前是用的别人组件,这里bug,哪里bug,感觉他非常的讨厌我一样,我像下定了某种决心,我自己弄一个,也是经过了一个下午,也是弄出来了,我自信满满的给测试妹子看,那测试妹子惊呆了,直接就是这眼神,这小眼神,感觉要吃了我一样,时间很快,到了中午,阳光像照进了我心里,暖暖的,当然主要是有妹子陪我吃饭,哈哈哈,这妹子从现在开始就特别崇拜我,慢慢的就过去了,一天有一天,到了放假时间了,她居然约我吃饭,我也是勉强的答应了,我从

时间:12/15/2025

AI学会理解物理法则OpenAI-Sora-2如何重塑视频生成新范式

AI学会理解物理法则OpenAI-Sora-2如何重塑视频生成新范式

OpenAI最新发布的Sora2标志着AI视频生成技术从视觉模仿迈向物理理解的重大突破。该模型通过强化物理一致性损失函数和材质嵌入空间,实现了对重力、流体力学等物理规律的隐性习得,使生成的1080p/20秒视频具备惊人的物理真实性。关键技术包括:分层时空编码器确保长视频一致性,思维链推理实现导演式分镜规划,动态分辨率调度优化计算效率。应用场景涵盖影视预演、科学可视化、交互式叙事等领域,显著提升创作效率。

时间:12/12/2025

视频推流平台EasyDSS无人机推流直播技术在水利巡检场景的应用与实践

视频推流平台EasyDSS无人机推流直播技术在水利巡检场景的应用与实践

我国水利基础设施规模庞大,涵盖水库、堤防、水闸、泵站等多种类型设施,传统的人工巡检方式面临效率低、风险高、时效性差等挑战。

时间:12/11/2025

记一次Qt视频监控系统的优化双击打开分组可能崩溃的BUG排对打开通道过程中关闭通道可能崩溃的BUG

记一次Qt视频监控系统的优化双击打开分组可能崩溃的BUG排对打开通道过程中关闭通道可能崩溃的BUG

摘要本文介绍了视频监控系统的功能优化过程。原系统双击打开分组时存在崩溃问题,经排查发现是由于离线通道和线程资源竞争导致。解决方案包括:将分组打开操作放入视频管理线程排队处理,设置合理间隔时间(默认0.1秒);增加分组打开完成状态判断,确保前一分组完全打开后再处理下一分组。改进后系统稳定性显著提升,支持64路通道同时打开且不受离线通道影响。系统具备多模块功能,包括视频监控、回放、电子地图等,支持多种流媒体协议和设备管理,采用模块化设计和跨平台架构,提供丰富的定制化选项和二次开发接口。相关代码展示了视频管理线

时间:12/11/2025

影视解说制作教程如何去除视频原音,添加配音和字幕

影视解说制作教程如何去除视频原音,添加配音和字幕

右键点击配音,选择“AI自动加字幕”,在弹出的窗口中选择识别语言(比如普通话),点击“开始识别”,等待几秒钟(根据配音时长而定),字幕就会自动生成,并且和配音精准同步,误差率低至2.5%。录制时找安静环境,避免背景噪音,语速保持每分钟180-200字,清晰不拖沓。次选AI配音:如果不想露声,可用免费的AI配音等工具,选择“解说腔”、“旁白腔”,调整语速和语调,避免机械感;选中视频片段,点击“画面旋转/裁剪”按钮,拖动裁剪框,避开水印和原字幕的位置,软件会自动适配画面比例,裁剪后画面依然完整,不会变形。

时间:12/10/2025

出海-APP-如何降低延迟腾讯云国际版-GME-音视频深度评测

出海-APP-如何降低延迟腾讯云国际版-GME-音视频深度评测

尤其是社交类、语聊房、游戏语音、直播互动等场景,对实时音视频的要求极高:声音延迟超过200ms就能明显破坏体验,视频抖动也会拉低用户留存。本篇文章将对GME的实时性能、全球网络、API易用度、实际测试延迟等方面进行深度分析,告诉你它是否真的适合作为出海APP的音视频方案。GME是腾讯云推出的一套全球游戏化音视频解决方案,最初用于腾讯系游戏语音,因此在强实时、弱网络环境优化方面表现突出。GME依托腾讯全球专线网络(T-ICN),在东南亚、中东、拉美均有节点,能快速回源到最近的数据中心。

时间:12/10/2025

使用JSMpeg实现移动端播放自动视频

使用JSMpeg实现移动端播放自动视频

在“系统变量”区域(下面那个框),找到名为Path的变量,选中它,点击“编辑”;1.下载https://www.gyan.dev/ffmpeg/builds/压缩包。ffmpeg-i“D:\项目\web\video\strategy.mp4”^//是否在不需要播放时延迟加载块-player无此属性。“D:\项目\web\video\strategy.ts”//是否解码音频-player无此属性。//是否解码视频-player无此属性。在新窗口中,点击“新建”;

时间:12/10/2025

60视频插帧DeepVoxelFlow融合光流与CNN的视频帧合成新范式

60视频插帧DeepVoxelFlow融合光流与CNN的视频帧合成新范式

3D体素流(F)是网络的核心输出,包含空间运动信息与时间混合权重空间运动成分:表示目标帧到下一帧的2D光流,其负值对应目标帧到前一帧的光流(假设光流在时间上线性对称)。时间混合成分:表示前一帧与后一帧的像素混合权重,用于融合两帧像素生成目标帧。FFmotionFmaskFFmotion​Fmask​其中,Fmotion∈RH×W×2Fmotion​∈RH×W×2)(H、W为帧高宽),Fmask∈RH×W×1F。

时间:12/09/2025

WebRTC-视频轨道Video-Outbound从采集到编码再到发送的完整流程解析

WebRTC-视频轨道Video-Outbound从采集到编码再到发送的完整流程解析

管线架构:WebRTC视频出站管线分为采集、处理、编码、发送四个阶段,渲染和编码并行处理。:核心的帧分发组件,采用发布-订阅模式,将帧数据广播给所有VideoSink订阅者。编码器抽象:通过接口实现编码器的可插拔设计,支持VP8、VP9、H264、AV1等多种格式。RTP封装:视频帧被切片为多个RTP包,每个包包含序列号、时间戳等关键元数据,最后一个分片设置Marker位。Pacing机制:通过平滑发送流量,避免突发数据造成网络拥塞。安全传输。

时间:12/09/2025

ffmpeg合成的视频在ios浏览器不能播放的问题

ffmpeg合成的视频在ios浏览器不能播放的问题

其根本原因就是,苹果系统对mp4文件有要求,必须符合苹果的要求,才能在苹果系统上播放。也就是常说的可能由于MP4压缩级别不够。使用-pix_fmtyuv420p将色度抽样设置为YUV4:2:0,这是大多数播放器和设备所支持的格式。使用了更为通用的视频编码参数-profile:vbaseline,这有助于提高视频在不同设备上的兼容性。如题所示,ios的浏览器播放不了mp4,但是能够在安卓上播放。在苹果自带的浏览器都是显示不能播放的图标。

时间:12/08/2025

Video-subtitle-remover-v1.1.0视频硬字幕去除工具

Video-subtitle-remover-v1.1.0视频硬字幕去除工具

VSRv1.1.0是一款基于AI技术的开源视频处理工具,可智能去除视频中的硬字幕和文本水印。该工具采用本地化运行,支持精准字幕识别、自然画面修复和多种操作模式,能保持视频原始画质。支持多格式处理,包括视频和图片批量去水印。需要NVIDIA显卡等硬件支持,适合视频剪辑爱好者、内容创作者等用户群体。

时间:12/05/2025

怎么又快又好的给视频加字幕介绍三个工具

怎么又快又好的给视频加字幕介绍三个工具

视频字幕生成工具推荐制作视频时手动添加字幕费时费力?推荐3款高效字幕软件:ViiTorAI:AI智能识别语音,支持19种语言互译,自动生成精准字幕,可调整样式并导出。剪映:抖音官方剪辑工具,一键AI识别字幕,智能对齐时间轴,适合短视频、Vlog快速制作。万兴喵影:强大视频编辑功能,支持语音转文字生成字幕,可设置双语字幕等选项。选对工具,字幕制作轻松搞定!

时间:12/03/2025

中国计算机学会CCF推荐学术会议-B计算机网络NOSSDAV-2026

中国计算机学会CCF推荐学术会议-B计算机网络NOSSDAV-2026

大会官网:https://nossdav.org/2026/录用率:38.9%(14/36,2025年)时间地点:2026年4月4日-香港·中国。截稿时间:2026年1月17日。CCF推荐:B(计算机网络)

时间:12/03/2025

视频直播点播平台EasyDSS构建安全高效的医疗培训直播新体系

视频直播点播平台EasyDSS构建安全高效的医疗培训直播新体系

医疗培训的数字化转型不是简单的技术应用,而是医疗教育模式的深刻变革。

时间:12/02/2025

EasyGBS新版本v3.7.168发布视频能力再度升级

EasyGBS新版本v3.7.168发布视频能力再度升级

同时优化核心交互逻辑,移除冗余功能,进一步提升平台在安防监控、直播分发等场景的适配性与稳定性。

时间:12/02/2025

上一页
12345...23
下一页第 1 / 23 页