TechBlog
首页分类标签搜索关于
← 返回标签列表
加载中...

© 2025 TechBlog. All rights reserved.

#标签

共 546 篇文章
Stable-Diffusion-AIGC-视觉设计实战教程之-08-高级图像处理

Stable-Diffusion-AIGC-视觉设计实战教程之-08-高级图像处理

本文系统梳理StableDiffusion的高清放大与高级图像处理方案:详解Hires.fix两阶段重绘、后期处理、图生图、SDUpscale、UltimateSDUpscale、TiledDiffusion等六种放大策略及参数设置;介绍Layerdiffusion原生透明图生成、ADetailer人脸手部智能修复、InpaintAnything点击分割重绘三大插件用法;并说明PNG元数据读取与保护技巧,为AIGC视觉设计提供一站式技术参考。

时间:12/23/2025

卫星插画推荐星轨下的科技美学像素漫画图赏

卫星插画推荐星轨下的科技美学像素漫画图赏

它就好像有一种神奇的魔力,把卫星那种严谨的感觉,画成了一个会呼吸的故事。图片核心元素表达:这张图片的主题是:卫星的‘不完美’星图:插画师的草稿笔记、宇宙探索中的行星与恒星,图片中包含的元素有:不完美星图草稿笔记手绘科技。图片核心元素表达:这张图片的主题是:星轨尽头的卫星:插画中的静谧科技感、在轨道上有一颗先进的卫星,图片中包含的元素有:星轨尽头静谧科技插画夜景。图片核心元素表达:这张图片的主题是:插画里的卫星:星链与城市轮廓的碰撞、太空站中的卫星,图片中包含的元素有:星链插画城市轮廓碰撞视角。

时间:12/18/2025

鼎道AIGUI元件体系如何让DingOS实现积木式交互

鼎道AIGUI元件体系如何让DingOS实现积木式交互

DingOS-AIGUI的元件体系通过灵活的排列组合,让DingOS能够像搭积木一样动态生成适应用户需求的界面

时间:12/17/2025

NVIDIA-HGX-B300-GPU-Droplet-服务器,即将上线DigitalOcean-云平台

NVIDIA-HGX-B300-GPU-Droplet-服务器,即将上线DigitalOcean-云平台

人工智能正以史无前例的速度演进,新的模型和繁重的负载不断突破可能的边界。从复杂的大型语言模型(LLM)到精密的科学模拟,开发者与企业都需要获得最强大、最高效的算力基础设施。在DigitalOcean,我们致力于提供顶级的算力资源,让你的团队能够以简单且经济的方式构建、部署并扩展AI项目。因此,我们激动地宣布:即将推出由加速的,这标志着我们GPU产品的一次重大升级。目前,中国区及亚太企业可与预约测试和预定。

时间:12/16/2025

AIGCSCAIL通过对-3D-一致姿态表示进行上下文学习,实现工作室级角色动画

AIGCSCAIL通过对-3D-一致姿态表示进行上下文学习,实现工作室级角色动画

SCAIL:通过对3D一致姿态表示进行上下文学习,实现工作室级角色动画

时间:12/15/2025

AI核心知识50大语言模型之Scaling-Laws简洁且通俗易懂版

AI核心知识50大语言模型之Scaling-Laws简洁且通俗易懂版

ScalingLaws(缩放定律)是AI领域的核心规律,揭示了模型参数量、训练数据量和计算算力三要素与AI性能之间的幂律关系。该定律使AI发展从"炼丹"变为可预测的工程,推动OpenAI等公司开展算力军备竞赛。DeepMind提出的Chinchilla定律修正了早期观点,强调参数量与数据量需同步增长。当前面临数据短缺和算力瓶颈两大挑战,但若该定律持续有效,AI性能仍将快速提升。这一"大力出奇迹"的黄金法则,预示着GPT-4可能只是AI发展的起点。

时间:12/12/2025

python获取飞书文档内容

python获取飞书文档内容

python获取飞书文档内容

时间:12/10/2025

豆包手机是如何完成任务操作的

豆包手机是如何完成任务操作的

今天刷抖音看到了豆包手机的视频,正好之前实习的时候做过豆包的微调,没想到这么快就落地了,于是对于底层的原理很好奇故进行一个总结,肯定有不少问题,而且很浅,如果有大佬希望能赐教(虽然准备秋招找开发岗,但还是想紧跟AI潮流哈哈)我觉得主要难点在第2条,虽然我之前接触过nlp模型,但是完全没法想象服务器端的大模型参数量是多么庞大,每次预测结果可能有好几百个词吧,一次生成一个token串行100次都能实现实时响应那得是多大的内存和多少cpu并行。

时间:12/05/2025

技术实战Crocs如何构建AI驱动的智能内容矩阵,实现内容播放量提升470

技术实战Crocs如何构建AI驱动的智能内容矩阵,实现内容播放量提升470

摘要:Crocs通过构建智能内容矩阵技术平台,实现全球化内容运营的数字化转型。该系统采用多智能体用户模拟、AI策略生成和自动化内容生产三大模块,结合数据闭环优化机制,显著提升运营效率:内容生产周期缩短80%,播放量提升470%,决策响应时间减少96%。案例证明,将AI技术与工程架构结合,采用人机协同模式,可有效解决规模化内容生产与品牌一致性问题,为AI工程化落地提供示范。未来随着多模态大模型发展,此类系统有望成为企业数字营销的核心基础设施。

时间:12/05/2025

PS-结构参考-Firefly零建模量产-2.5D-等轴游戏资产

PS-结构参考-Firefly零建模量产-2.5D-等轴游戏资产

这篇文章,就跟各位同学分享一下结合了Photoshop(Firefly)结构参考(StructureReference)的2.5D量产工作流。它能让你在没有任何3D基础的情况下,仅用简单的色块,就能量产出透视完美、风格统一的游戏建筑。

时间:11/29/2025

Kthena-引爆云原生推理革命K8s-分布式架构破解-LLM-编排困局,吞吐狂飙-273

Kthena-引爆云原生推理革命K8s-分布式架构破解-LLM-编排困局,吞吐狂飙-273

本文探讨了云原生环境下大语言模型(LLM)推理部署的技术挑战与解决方案。LLM推理具有有状态特性、多元引擎需求、并行计算依赖等独特技术属性,传统架构面临性能瓶颈与运维困境。Kthena作为开源项目,通过四大核心组件重构了LLM推理的编排范式:Router网关实现智能调度,ControllerManager提供全生命周期管理,ModelServing支持灵活部署形态,ModelBooster优化模型性能。其创新设计包括三层架构简化管理、Gang调度确保完整性、拓扑感知降低时延等,为千亿级参数模型的企业级落地

时间:11/29/2025

AI核心知识21大语言模型之核心参数Temperature简洁且通俗易懂版

AI核心知识21大语言模型之核心参数Temperature简洁且通俗易懂版

温度参数是调节大语言模型输出随机性的关键设置。低温度(0.1-0.3)使AI回答更稳定保守,适合编程、数学等严谨任务;高温度(0.8-1.2)增加创造性,适合写作、创意场景,但可能产生不连贯内容。温度通过改变词语选择概率分布来工作:低温强化高频词选择,高温提升低频词机会。最佳设置需根据任务需求平衡:事实性任务用低温,创意任务用高温。注意温度仅控制随机性,不能纠正AI的知识错误。

时间:11/28/2025

科技互联网宣传图片素材推荐从灵感碎片到落地场景的实用分享

科技互联网宣传图片素材推荐从灵感碎片到落地场景的实用分享

打开那些混着代码余温的科技图包时,像蹲在深夜办公室角落翻旧笔记:深蓝电路在褶皱里没对齐,悬浮图标在渐变光影里晃得有点跳,拿铁杯旁的智能屏好像刚被咖啡热气熏过——这些没整理的“灵感碎片”,有的还带着加班时没保存的代码残影,有的像数据粒子在半透明界面里偷偷流窜。当然你也可以在平台检索当前主题:#不规则几何##办公场景##渐变色块##拿铁杯旁的智能屏##折痕里的电路#,触达更多关于。主题:#折痕里的电路##半亮的全息图##未对齐的接口#主题:#办公场景##智能设备##未保存的代码#

时间:11/25/2025

AI-驱动业务的致命风险如何用架构设计守住安全底线

AI-驱动业务的致命风险如何用架构设计守住安全底线

传统API调用有明确的调用栈和权限边界,而AI的FunctionCalling具有动态性、不可预测性,这意味着企业不能只追求功能实现,更要为AI构建一套“约束性架构”,这正是AI驱动业务从“Demo可用”到“生产可靠”的核心鸿沟。毕竟,真正有价值的企业级AI应用,从来不是“无所不能”,而是“有所为、有所不为”,在释放技术潜力的同时,守住安全底线。其核心设计是“推荐而非决策”:AI不直接改变业务状态,仅输出审批建议及分析理由,即使是批量操作,也需人类最终确认。

时间:11/22/2025

Vibe-Coding之道从Hulk扩展程序看Prompt工程的艺术

Vibe-Coding之道从Hulk扩展程序看Prompt工程的艺术

在AI编程助手日益普及的今天,我们正经历着编程范式的深刻转变。传统的"手写每一行代码"正在向"精准指导AI生成代码"演进。这种基于氛围和直觉的编程方式,我称之为VibeCoding。VibeCoding不是懒散,而是"松弛且高效的协作状态"。它让代码不再是障碍,而是实现创意的工具。

时间:11/16/2025

考研论文引用格式-AI-校验实操工具合集-技术原理

考研论文引用格式-AI-校验实操工具合集-技术原理

论文引用格式校对面临三大技术难点:标准规则复杂、跨格式转换困难、批量处理易错。AI技术通过三层架构解决,推荐四类工具。需注意AI无法识别虚假引用,建议结合人工核查,并关注特殊文献类型和院校个性化要求。未来趋势包括多模态解析升级、诚信校验强化和定制模型普及。AI工具可提升效率,但仍需以学术规范为根本遵循。

时间:11/14/2025

每日AIGC最新进展94MIT提出实时流式视频生成StreamDiffusionV2LeCun李飞飞谢赛宁联合提出空间超感知Cambrian-S

每日AIGC最新进展94MIT提出实时流式视频生成StreamDiffusionV2LeCun李飞飞谢赛宁联合提出空间超感知Cambrian-S

MIT提出实时流式视频生成StreamDiffusionV2、LeCun&李飞飞&谢赛宁联合提出空间超感知Cambrian-S

时间:11/14/2025

Claude-Code-重大更新支持一键原生安装,彻底别了-Node.js

Claude-Code-重大更新支持一键原生安装,彻底别了-Node.js

ClaudeCode官方最新推出原生安装方式,大大简化安装流程,让所有用户都能轻松快捷地部署这款强大的AI编程工具。从此,您无需再为繁琐的Node.js环境配置而烦恼。一个安装包,一个命令,即可开启您的高效AI编程之旅。

时间:11/11/2025

司马阅与铨亿科技达成生态战略合作,AI赋能工业领域智能化转型

司马阅与铨亿科技达成生态战略合作,AI赋能工业领域智能化转型

其服务旨在助力企业,特别是中小型制造商,以更务实的方式应用AI与数据技术,实现智能制造的关键跨越,在产业升级中把握先机。基于自研文档智能模型DocMind(已获国家模型备案),司马阅开发了国产领先的AI文档智能体平台,助力企业严肃场景AI落地,将企业大量非结构化文档数据转化为"大模型可理解"的标准化数据,有效控制大模型幻觉,AI回答更精准、更落地。成都三生万物科技有限公司旗下的核心AI品牌司马阅,专注在文档智能、数据智能方向深度探索,致力于加速企业从数字化向AI智能化的转型。

时间:11/05/2025

AIGC中stable-diffusion安装部署

AIGC中stable-diffusion安装部署

注意VENV_DIR这行代码,不会创建新的虚拟环境,使用anconda的虚拟环境。5、修改启动脚本,将webui-user.bat文件进行修改。1、利用anconda安装pytorchgpu的环境。3、安装stable-diffusion-webui。2、win下安装git。

时间:11/04/2025

华为发布Atlas-900-DeepGreen-AI服务器单机柜100PF算力重构AI训练基础设施

华为发布Atlas-900-DeepGreen-AI服务器单机柜100PF算力重构AI训练基础设施

2025年11月1日,华为突然发布全新一代Atlas900DeepGreenAI服务器,单机柜算力达到惊人的100PFpms,直接将AI训练基础设施的算力密度提升了一个数量级!这不是简单的硬件升级,而是华为用自研AI芯片和鲲鹏处理器的深度协同,在能效比上甩出行业平均水平40%的“算力核武器”。当整个行业还在为大模型训练的天价电费发愁时,华为这步棋,可能彻底改写AI算力竞赛的规则!

时间:11/03/2025

Sora-2从视频生成到世界模拟,OpenAI的终极游戏

Sora-2从视频生成到世界模拟,OpenAI的终极游戏

OpenAI推出Sora2视频生成模型,通过扩散变换器(DiT)和时空补丁技术实现高质量视频生成,并具备物理世界模拟能力。该模型在物理真实感、音视频同步等方面表现突出,但仍存在物理逻辑错误等问题。OpenAI同步推出SoraApp社交平台,推动AI视频创作大众化。开发者可通过API快速接入Sora2,开启智能视频创作新时代。文章指出,AI只是工具,真正的创造力仍来自人类对世界的理解与洞察。

时间:10/31/2025

openAI发布的AI浏览器什么是Atlas含-ChatGPT-浏览功能macOS-离线下载安装Atlas完整教程

openAI发布的AI浏览器什么是Atlas含-ChatGPT-浏览功能macOS-离线下载安装Atlas完整教程

OpenAI发布的AI浏览器Atlas是一款集成ChatGPT浏览功能的macOS应用。安装要求包括macOS 12+系统、1GB存储空间和正常网络连接。安装过程需下载DMG文件并拖拽至应用程序文件夹,首次启动需处理系统安全提示并登录ChatGPT账号。支持从Chrome/Safari导入浏览数据,可设置默认浏览器和个性化选项。提供隐私控制、自动更新等功能,卸载时需清理相关配置文件。常见问题包括安装失败、登录问题等,可通过系统设置调整权限解决。

时间:10/22/2025

DeepSeek刚刚开源了一个3B的-OCR模型什么是DeepSeek-OCR单张A100-40G每天可以处理20万页文档

DeepSeek刚刚开源了一个3B的-OCR模型什么是DeepSeek-OCR单张A100-40G每天可以处理20万页文档

DeepSeek开源了3B参数的OCR模型DeepSeek-OCR,该模型通过视觉压缩技术将整页图像转换为64-128个视觉token,实现高效文档处理(单A100每天可处理20万页)。相比传统OCR,它兼具语义理解能力,支持图表解析、多语言识别等功能,压缩10倍仍保持97%精度。文中提供了HuggingFace部署教程,并推荐了可免费体验的云GPU平台(如GPU Space),帮助用户无需本地显卡即可测试。该模型被视为视觉RAG的重要基础,有望推动大模型的视觉理解能力发展。

时间:10/21/2025

上一页
12345...23
下一页第 1 / 23 页