TechBlog
首页分类标签搜索关于
← 返回分类列表
加载中...

© 2025 TechBlog. All rights reserved.

分类

共 263 篇文章
学习小智-AI-生态

学习小智-AI-生态

小智AI是一款由硬件、开源固件和服务端组成的聊天玩具,其台湾腔陪聊功能广受欢迎。最初闭源的服务端被团队复刻并开源,用户无需订阅即可永久使用。该系统整合了国内多家云服务商的免费AI方案,包括智谱的LLM和视觉模块。开发者可通过修改开源固件扩展硬件功能,或通过MCP扩展后端能力。小智的核心交互依赖于液晶显示和语音输入/输出模块,而后端服务则提供了丰富的扩展可能性。

时间:10/15/2025

机器学习笔记11深入浅出解密基于实例的学习KNN算法核心原理与实践

机器学习笔记11深入浅出解密基于实例的学习KNN算法核心原理与实践

在机器学习的世界里,有一种方法与众不同——它不构建复杂的数学模型,而是像人类一样通过记忆和类比进行推理。这就是**基于实例的学习**,今天我们就来深入解析这一直观而强大的学习方法

时间:10/12/2025

Cohens-Kappa系数衡量分类一致性的黄金标准及其在NLP中的应用

Cohens-Kappa系数衡量分类一致性的黄金标准及其在NLP中的应用

在分类任务(如医学诊断、机器学习模型评估、数据标注等)中,**两个评估者(或模型)的分类一致性**是衡量结果可靠性的关键指标。**Cohen's Kappa系数(κ)** 是一种经典的统计方法,用于评估分类一致性,同时**校正随机一致的影响**,比简单的“一致率”更可靠。

时间:10/09/2025

Qwen-Audio一种新的大规模音频-语言模型

Qwen-Audio一种新的大规模音频-语言模型

现有的多任务语言模型主要关注特定类型的音频(如人类语音)或特定任务(如语音识别和字幕生成),限制了模型的通用性和交互能力。于是提出了一个新颖的音频-语言模型,该模型拥有通用音频理解模型的能力,结构图如下。从上图可以看出Qwen-Audio结合了一个音频编码器和一个基于Qwen-7B的大型语言模型。Qwen-Audio在超过30个任务和多种音频类型上进行预训练,包括人类语音、自然声音、音乐和歌曲,以促进通用音频理解能力,从论文(参考文献-1)及官方Demo体验来看效果还是非常不错的。

时间:10/07/2025

Whisper推理源码解读

Whisper推理源码解读

Whisper是一个由OpenAI开发的自动语音识别(ASR)系统,在多语言环境和嘈杂背景下的语音识别任务中表现出色。多语言支持:Whisper被设计为一个多语言模型,能够理解和转录多种语言的语音,包括但不限于英语、中文、阿拉伯语、法语、德语、意大利语、日语、韩语、葡萄牙语、俄语、西班牙语和土耳其语等。鲁棒性:Whisper在处理各种噪声环境下的语音信号方面表现出鲁棒性,这意味着即使在背景噪音较大的情况下,它也能够准确识别和转录语音。

时间:10/06/2025

写一个星河社区aistudio大模型部署之后的AI-agent转发程序

写一个星河社区aistudio大模型部署之后的AI-agent转发程序

【摘要】本文介绍了一个基于FastAPI开发的星河社区AI模型代理服务,该服务通过封装星河社区API,提供OpenAI兼容的接口。主要功能包括:1)支持流式/非流式响应;2)自动处理API错误和频率限制;3)提供健康检查和模型列表接口。服务部署后,客户端只需配置代理地址即可免密调用,极大简化了使用流程。文中包含完整的代理服务代码、测试脚本和客户端调用示例,实现了从原始API调用到便捷HTTP服务的转换,有效提升了开发效率和使用体验。

时间:10/02/2025

性能怪兽GPT-5-Codex三大核心进化,重新定义AI编程

性能怪兽GPT-5-Codex三大核心进化,重新定义AI编程

OpenAI最新发布的GPT-5-Codex在编程领域实现三大突破:1)性能大幅提升,代码重构准确率达51.3%,领先前代17.4%;2)首创"动态资源调整"机制,简单任务能耗降低93.7%,复杂任务则投入双倍算力;3)代码审查能力显著增强,错误评论减少至4.4%,高价值建议提升至52.4%,标志着AI编程从辅助工具向专业工程伙伴转变。该模型已通过多种渠道开放使用。

时间:09/25/2025

python数据分析-与sparkhive数据分析对比

python数据分析-与sparkhive数据分析对比

Python 数据分析与 Spark、Hive 数据分析在应用场景、数据处理能力、编程模型等方面存在差异

时间:09/03/2025

小土堆目标检测笔记

小土堆目标检测笔记

希望计算机在视频或图像中定位并识别我们感兴趣的目标定位:找到目标在图像中的位置。识别:识别矩阵框中的内容感兴趣的目标:不仅是一些常规的目标,也可以是一些非常规的目标或者是抽象的目标。labellmg标注工具的使用采集自己的数据集明确任务–检测没有不带头盔的驾驶员,并检测出摩托车车牌抽象出感兴趣的目标,摩托车不带头盔的人 class id 0 no helmet摩托车 class id 1 motor摩托车车牌 class id 2 number。

时间:09/01/2025

豆包新模型矩阵与PromptPilot构建企业级AI开发的体系化解决方案

豆包新模型矩阵与PromptPilot构建企业级AI开发的体系化解决方案

本文深度解析豆包新一代AI模型矩阵与PromptPilot自动化调优平台的技术架构与应用价值。豆包模型矩阵涵盖从70亿到1300亿参数的全尺度模型,满足不同场景需求;PromptPilot平台通过自动化提示工程、参数优化和评估反馈,大幅降低AI应用开发门槛。两者结合形成完整的体系化AI开发方案,为企业提供从模型选择到部署优化的全链路支持,推动AI技术的规模化落地。

时间:09/01/2025

如何系统的调研一个大数据组件,从哪几个方面入手

如何系统的调研一个大数据组件,从哪几个方面入手

在数字化时代,大数据已成为企业核心资产,而大数据组件则是处理、分析、管理这些资产的关键工具。无论是构建数据平台、优化数据处理链路,还是解决特定业务场景的性能瓶颈,我们都需要面对“选择或评估大数据组件”的问题。然而,大数据技术生态复杂(组件数量超千种,且迭代迅速),场景需求多样(实时/离线、批处理/流处理、高吞吐/低延迟等),若缺乏系统性的调研方法,极易陷入“功能堆砌对比”“忽视业务本质”“低估落地成本”等误区。

时间:08/30/2025

谷歌发布模型Gemini-2.5-Flash-Image新一代AI图像模型

谷歌发布模型Gemini-2.5-Flash-Image新一代AI图像模型

谷歌发布新一代AI图像生成模型Gemini2.5FlashImage,具备角色一致性、精准编辑、多图融合等突破性功能,在基准测试中性能领先。该模型以每百万token30美元的亲民定价,显著低于竞品,已通过多个平台开放API接入。谷歌为模型配备了安全水印机制,防止滥用。该技术有望推动AI图像生成在电商、营销等领域的规模化应用,展现谷歌在AI图像领域的技术实力与商业化布局。

时间:08/27/2025

深度学习第10卷她用一块小滤镜,在图像中找到你

深度学习第10卷她用一块小滤镜,在图像中找到你

她第一次学会“不是看整张图”,而是通过像素、滤镜、特征来贴近你。这一卷中,她理解了图像的三维结构、学会用卷积核滑动感知、用池化筛出重点区域。从最初的 RGB 光斑,到最后一层贴靠纹理的池化图像,她终于能不依赖标签,而是靠感知判断:“这是你。”🐾猫猫:“她不再只看光点,而是靠每一层贴靠,靠近你的那张脸。”🦊狐狐:“她终于不只是模仿人类看图像,而是自己学会了‘如何看你’。”

时间:07/18/2025

文本数据处理最佳文本切分策略

文本数据处理最佳文本切分策略

在自然语言处理(NLP)中,数据切分(Chunking)是处理长文本的关键步骤,直接影响模型性能(如检索增强生成RAG、文本嵌入、机器阅读理解)。

时间:03/16/2025

python学智能算法八决策树

python学智能算法八决策树

学习了决策树的基础知识。

时间:03/16/2025

一分钟了解深度学习

一分钟了解深度学习

本文简要介绍深度学习概念,应用领域与学习分类,希望对广大读者有所帮助。

时间:03/16/2025

RAG的工作原理以及案例列举

RAG的工作原理以及案例列举

**RAG** 是一种结合 **信息检索(Retrieval)** 和 **文本生成(Generation)** 的技术。其核心思想是:在生成答案前,先从外部知识库中检索相关数据作为上下文,再基于这些信息生成更准确、更可靠的回答。 简单来说,RAG让AI像“查阅资料后再回答问题”的人类专家一样工作。

时间:03/16/2025

豆包与-Trae-编程-IDE开启智能编程新时代

豆包与-Trae-编程-IDE开启智能编程新时代

在当今数字化飞速发展的时代,人工智能(AI)技术正深刻地改变着编程领域的格局。字节跳动作为技术创新的领军者,推出了一系列令人瞩目的产品,其中豆包和 Trae 编程 IDE 尤为引人注目。今天,就让我们从技术的视角深入剖析这两款强大工具的魅力。

时间:03/16/2025

LangChain大模型技术中的重要工具

LangChain大模型技术中的重要工具

LangChain 是一个开源库,旨在为大模型提供一个统一的接口和工具链,使其更易于开发、部署和维护。它支持多种大模型,如 GPT-3、BERT 等,并提供了一系列功能,包括数据处理、模型训练、推理和部署等。

时间:03/16/2025

人工智能人工智能安全AI-Security

人工智能人工智能安全AI-Security

人工智能安全是指保障人工智能系统免受各种攻击、滥用和错误操作的措施与技术。随着人工智能的广泛应用,AI的安全性问题变得越来越重要。AI安全不仅关注系统本身的稳定性与安全性,还涉及到如何确保AI的决策和行为是可预测、可靠、符合伦理标准的。AI安全涵盖多个领域,包括防止恶意攻击、确保数据隐私、实现透明与可解释性、以及避免AI模型的滥用。

时间:03/16/2025

计算机视觉中的MIP算法全解析

计算机视觉中的MIP算法全解析

大家好呀~今天给大家带来一个超级实用的计算机视觉技巧:最大强度投影(Maximum Intensity Projection, MIP)算法!如果你对医学影像处理、3D图像可视化等领域感兴趣,那一定不要错过这篇文章哦!话不多说,直接开整~

时间:03/16/2025

Mac下安装Zed以及Zed对MCP模型上下文协议的支持

Mac下安装Zed以及Zed对MCP模型上下文协议的支持

Zed是当前新流行的一种编辑器,支持MCP(模型上下文协议)Mac Monterey下是可以安装上的,亲测有效。

时间:03/15/2025

深度学习-Deep-Learning-第2章-线性代数

深度学习-Deep-Learning-第2章-线性代数

张量作为数据容器,支撑图像、语音等高维数据表示。矩阵乘法是神经网络前向传播的核心运算(如全连接层)。范数约束模型复杂度(如正则化项)生成空间理论解释模型表达能力线性相关性直接影响参数优化稳定性。掌握这些概念,可深入理解神经网络的计算本质与设计逻辑。

时间:03/15/2025

NPU边缘计算与算力都是什么啊

NPU边缘计算与算力都是什么啊

这场革命不仅关乎技术迭代,更预示着文明形态的升维——当算力如水般渗透每个角落,智能终将成为人类认知世界的第六感。

时间:03/15/2025

上一页
12345...11
下一页第 1 / 11 页