首页分类标签搜索关于

← 返回标签列表

加载中...

© 2025 TechBlog. All rights reserved.

#标签

共 546 篇文章

Stable-Diffusion-AIGC-视觉设计实战教程之-08-高级图像处理

Stable-Diffusion-AIGC-视觉设计实战教程之-08-高级图像处理

本文系统梳理StableDiffusion的高清放大与高级图像处理方案：详解Hires.fix两阶段重绘、后期处理、图生图、SDUpscale、UltimateSDUpscale、TiledDiffusion等六种放大策略及参数设置；介绍Layerdiffusion原生透明图生成、ADetailer人脸手部智能修复、InpaintAnything点击分割重绘三大插件用法；并说明PNG元数据读取与保护技巧，为AIGC视觉设计提供一站式技术参考。

时间：12/23/2025

卫星插画推荐星轨下的科技美学像素漫画图赏

卫星插画推荐星轨下的科技美学像素漫画图赏

它就好像有一种神奇的魔力，把卫星那种严谨的感觉，画成了一个会呼吸的故事。图片核心元素表达：这张图片的主题是：卫星的‘不完美’星图：插画师的草稿笔记、宇宙探索中的行星与恒星,图片中包含的元素有：不完美星图草稿笔记手绘科技。图片核心元素表达：这张图片的主题是：星轨尽头的卫星：插画中的静谧科技感、在轨道上有一颗先进的卫星,图片中包含的元素有：星轨尽头静谧科技插画夜景。图片核心元素表达：这张图片的主题是：插画里的卫星：星链与城市轮廓的碰撞、太空站中的卫星,图片中包含的元素有：星链插画城市轮廓碰撞视角。

时间：12/18/2025

鼎道AIGUI元件体系如何让DingOS实现积木式交互

鼎道AIGUI元件体系如何让DingOS实现积木式交互

DingOS-AIGUI的元件体系通过灵活的排列组合，让DingOS能够像搭积木一样动态生成适应用户需求的界面

时间：12/17/2025

NVIDIA-HGX-B300-GPU-Droplet-服务器,即将上线DigitalOcean-云平台

NVIDIA-HGX-B300-GPU-Droplet-服务器,即将上线DigitalOcean-云平台

人工智能正以史无前例的速度演进，新的模型和繁重的负载不断突破可能的边界。从复杂的大型语言模型（LLM）到精密的科学模拟，开发者与企业都需要获得最强大、最高效的算力基础设施。在DigitalOcean，我们致力于提供顶级的算力资源，让你的团队能够以简单且经济的方式构建、部署并扩展AI项目。因此，我们激动地宣布：即将推出由加速的，这标志着我们GPU产品的一次重大升级。目前，中国区及亚太企业可与预约测试和预定。

时间：12/16/2025

AIGCSCAIL通过对-3D-一致姿态表示进行上下文学习,实现工作室级角色动画

AIGCSCAIL通过对-3D-一致姿态表示进行上下文学习,实现工作室级角色动画

SCAIL：通过对3D一致姿态表示进行上下文学习，实现工作室级角色动画

时间：12/15/2025

AI核心知识50大语言模型之Scaling-Laws简洁且通俗易懂版

AI核心知识50大语言模型之Scaling-Laws简洁且通俗易懂版

ScalingLaws（缩放定律）是AI领域的核心规律，揭示了模型参数量、训练数据量和计算算力三要素与AI性能之间的幂律关系。该定律使AI发展从"炼丹"变为可预测的工程，推动OpenAI等公司开展算力军备竞赛。DeepMind提出的Chinchilla定律修正了早期观点，强调参数量与数据量需同步增长。当前面临数据短缺和算力瓶颈两大挑战，但若该定律持续有效，AI性能仍将快速提升。这一"大力出奇迹"的黄金法则，预示着GPT-4可能只是AI发展的起点。

时间：12/12/2025

python获取飞书文档内容

python获取飞书文档内容

python获取飞书文档内容

时间：12/10/2025

豆包手机是如何完成任务操作的

豆包手机是如何完成任务操作的

今天刷抖音看到了豆包手机的视频，正好之前实习的时候做过豆包的微调，没想到这么快就落地了，于是对于底层的原理很好奇故进行一个总结，肯定有不少问题，而且很浅，如果有大佬希望能赐教（虽然准备秋招找开发岗，但还是想紧跟AI潮流哈哈）我觉得主要难点在第2条，虽然我之前接触过nlp模型，但是完全没法想象服务器端的大模型参数量是多么庞大，每次预测结果可能有好几百个词吧，一次生成一个token串行100次都能实现实时响应那得是多大的内存和多少cpu并行。

时间：12/05/2025

技术实战Crocs如何构建AI驱动的智能内容矩阵,实现内容播放量提升470

技术实战Crocs如何构建AI驱动的智能内容矩阵,实现内容播放量提升470

摘要：Crocs通过构建智能内容矩阵技术平台，实现全球化内容运营的数字化转型。该系统采用多智能体用户模拟、AI策略生成和自动化内容生产三大模块，结合数据闭环优化机制，显著提升运营效率：内容生产周期缩短80%，播放量提升470%，决策响应时间减少96%。案例证明，将AI技术与工程架构结合，采用人机协同模式，可有效解决规模化内容生产与品牌一致性问题，为AI工程化落地提供示范。未来随着多模态大模型发展，此类系统有望成为企业数字营销的核心基础设施。

时间：12/05/2025

PS-结构参考-Firefly零建模量产-2.5D-等轴游戏资产

PS-结构参考-Firefly零建模量产-2.5D-等轴游戏资产

这篇文章，就跟各位同学分享一下结合了Photoshop(Firefly)结构参考(StructureReference)的2.5D量产工作流。它能让你在没有任何3D基础的情况下，仅用简单的色块，就能量产出透视完美、风格统一的游戏建筑。

时间：11/29/2025

Kthena-引爆云原生推理革命K8s-分布式架构破解-LLM-编排困局,吞吐狂飙-273

Kthena-引爆云原生推理革命K8s-分布式架构破解-LLM-编排困局,吞吐狂飙-273

本文探讨了云原生环境下大语言模型(LLM)推理部署的技术挑战与解决方案。LLM推理具有有状态特性、多元引擎需求、并行计算依赖等独特技术属性，传统架构面临性能瓶颈与运维困境。Kthena作为开源项目，通过四大核心组件重构了LLM推理的编排范式：Router网关实现智能调度，ControllerManager提供全生命周期管理，ModelServing支持灵活部署形态，ModelBooster优化模型性能。其创新设计包括三层架构简化管理、Gang调度确保完整性、拓扑感知降低时延等，为千亿级参数模型的企业级落地

时间：11/29/2025

AI核心知识21大语言模型之核心参数Temperature简洁且通俗易懂版

AI核心知识21大语言模型之核心参数Temperature简洁且通俗易懂版

温度参数是调节大语言模型输出随机性的关键设置。低温度(0.1-0.3)使AI回答更稳定保守，适合编程、数学等严谨任务；高温度(0.8-1.2)增加创造性，适合写作、创意场景，但可能产生不连贯内容。温度通过改变词语选择概率分布来工作：低温强化高频词选择，高温提升低频词机会。最佳设置需根据任务需求平衡：事实性任务用低温，创意任务用高温。注意温度仅控制随机性，不能纠正AI的知识错误。

时间：11/28/2025

科技互联网宣传图片素材推荐从灵感碎片到落地场景的实用分享

科技互联网宣传图片素材推荐从灵感碎片到落地场景的实用分享

打开那些混着代码余温的科技图包时，像蹲在深夜办公室角落翻旧笔记：深蓝电路在褶皱里没对齐，悬浮图标在渐变光影里晃得有点跳，拿铁杯旁的智能屏好像刚被咖啡热气熏过——这些没整理的“灵感碎片”，有的还带着加班时没保存的代码残影，有的像数据粒子在半透明界面里偷偷流窜。当然你也可以在平台检索当前主题:#不规则几何##办公场景##渐变色块##拿铁杯旁的智能屏##折痕里的电路#，触达更多关于。主题：#折痕里的电路##半亮的全息图##未对齐的接口#主题：#办公场景##智能设备##未保存的代码#

时间：11/25/2025

AI-驱动业务的致命风险如何用架构设计守住安全底线

AI-驱动业务的致命风险如何用架构设计守住安全底线

传统API调用有明确的调用栈和权限边界，而AI的FunctionCalling具有动态性、不可预测性，这意味着企业不能只追求功能实现，更要为AI构建一套“约束性架构”，这正是AI驱动业务从“Demo可用”到“生产可靠”的核心鸿沟。毕竟，真正有价值的企业级AI应用，从来不是“无所不能”，而是“有所为、有所不为”，在释放技术潜力的同时，守住安全底线。其核心设计是“推荐而非决策”：AI不直接改变业务状态，仅输出审批建议及分析理由，即使是批量操作，也需人类最终确认。

时间：11/22/2025

Vibe-Coding之道从Hulk扩展程序看Prompt工程的艺术

Vibe-Coding之道从Hulk扩展程序看Prompt工程的艺术

在AI编程助手日益普及的今天，我们正经历着编程范式的深刻转变。传统的"手写每一行代码"正在向"精准指导AI生成代码"演进。这种基于氛围和直觉的编程方式，我称之为VibeCoding。VibeCoding不是懒散，而是"松弛且高效的协作状态"。它让代码不再是障碍，而是实现创意的工具。

时间：11/16/2025

考研论文引用格式-AI-校验实操工具合集-技术原理

考研论文引用格式-AI-校验实操工具合集-技术原理

论文引用格式校对面临三大技术难点：标准规则复杂、跨格式转换困难、批量处理易错。AI技术通过三层架构解决，推荐四类工具。需注意AI无法识别虚假引用，建议结合人工核查，并关注特殊文献类型和院校个性化要求。未来趋势包括多模态解析升级、诚信校验强化和定制模型普及。AI工具可提升效率，但仍需以学术规范为根本遵循。

时间：11/14/2025

每日AIGC最新进展94MIT提出实时流式视频生成StreamDiffusionV2LeCun李飞飞谢赛宁联合提出空间超感知Cambrian-S

每日AIGC最新进展94MIT提出实时流式视频生成StreamDiffusionV2LeCun李飞飞谢赛宁联合提出空间超感知Cambrian-S

MIT提出实时流式视频生成StreamDiffusionV2、LeCun&李飞飞&谢赛宁联合提出空间超感知Cambrian-S

时间：11/14/2025

Claude-Code-重大更新支持一键原生安装,彻底别了-Node.js

Claude-Code-重大更新支持一键原生安装,彻底别了-Node.js

ClaudeCode官方最新推出原生安装方式，大大简化安装流程，让所有用户都能轻松快捷地部署这款强大的AI编程工具。从此，您无需再为繁琐的Node.js环境配置而烦恼。一个安装包，一个命令，即可开启您的高效AI编程之旅。

时间：11/11/2025

司马阅与铨亿科技达成生态战略合作,AI赋能工业领域智能化转型

司马阅与铨亿科技达成生态战略合作,AI赋能工业领域智能化转型

其服务旨在助力企业，特别是中小型制造商，以更务实的方式应用AI与数据技术，实现智能制造的关键跨越，在产业升级中把握先机。基于自研文档智能模型DocMind（已获国家模型备案），司马阅开发了国产领先的AI文档智能体平台，助力企业严肃场景AI落地，将企业大量非结构化文档数据转化为"大模型可理解"的标准化数据，有效控制大模型幻觉，AI回答更精准、更落地。成都三生万物科技有限公司旗下的核心AI品牌司马阅，专注在文档智能、数据智能方向深度探索，致力于加速企业从数字化向AI智能化的转型。

时间：11/05/2025

AIGC中stable-diffusion安装部署

AIGC中stable-diffusion安装部署

注意VENV_DIR这行代码，不会创建新的虚拟环境，使用anconda的虚拟环境。5、修改启动脚本，将webui-user.bat文件进行修改。1、利用anconda安装pytorchgpu的环境。3、安装stable-diffusion-webui。2、win下安装git。

时间：11/04/2025

华为发布Atlas-900-DeepGreen-AI服务器单机柜100PF算力重构AI训练基础设施

华为发布Atlas-900-DeepGreen-AI服务器单机柜100PF算力重构AI训练基础设施

2025年11月1日，华为突然发布全新一代Atlas900DeepGreenAI服务器，单机柜算力达到惊人的100PFpms，直接将AI训练基础设施的算力密度提升了一个数量级！这不是简单的硬件升级，而是华为用自研AI芯片和鲲鹏处理器的深度协同，在能效比上甩出行业平均水平40%的“算力核武器”。当整个行业还在为大模型训练的天价电费发愁时，华为这步棋，可能彻底改写AI算力竞赛的规则！

时间：11/03/2025

Sora-2从视频生成到世界模拟,OpenAI的终极游戏

Sora-2从视频生成到世界模拟,OpenAI的终极游戏

OpenAI推出Sora2视频生成模型，通过扩散变换器(DiT)和时空补丁技术实现高质量视频生成，并具备物理世界模拟能力。该模型在物理真实感、音视频同步等方面表现突出，但仍存在物理逻辑错误等问题。OpenAI同步推出SoraApp社交平台，推动AI视频创作大众化。开发者可通过API快速接入Sora2，开启智能视频创作新时代。文章指出，AI只是工具，真正的创造力仍来自人类对世界的理解与洞察。

时间：10/31/2025

openAI发布的AI浏览器什么是Atlas含-ChatGPT-浏览功能macOS-离线下载安装Atlas完整教程

openAI发布的AI浏览器什么是Atlas含-ChatGPT-浏览功能macOS-离线下载安装Atlas完整教程

OpenAI发布的AI浏览器Atlas是一款集成ChatGPT浏览功能的macOS应用。安装要求包括macOS 12+系统、1GB存储空间和正常网络连接。安装过程需下载DMG文件并拖拽至应用程序文件夹，首次启动需处理系统安全提示并登录ChatGPT账号。支持从Chrome/Safari导入浏览数据，可设置默认浏览器和个性化选项。提供隐私控制、自动更新等功能，卸载时需清理相关配置文件。常见问题包括安装失败、登录问题等，可通过系统设置调整权限解决。

时间：10/22/2025

DeepSeek刚刚开源了一个3B的-OCR模型什么是DeepSeek-OCR单张A100-40G每天可以处理20万页文档

DeepSeek刚刚开源了一个3B的-OCR模型什么是DeepSeek-OCR单张A100-40G每天可以处理20万页文档

DeepSeek开源了3B参数的OCR模型DeepSeek-OCR，该模型通过视觉压缩技术将整页图像转换为64-128个视觉token，实现高效文档处理（单A100每天可处理20万页）。相比传统OCR，它兼具语义理解能力，支持图表解析、多语言识别等功能，压缩10倍仍保持97%精度。文中提供了HuggingFace部署教程，并推荐了可免费体验的云GPU平台（如GPU Space），帮助用户无需本地显卡即可测试。该模型被视为视觉RAG的重要基础，有望推动大模型的视觉理解能力发展。

时间：10/21/2025

上一页

1 2 3 4 5...23

下一页第 1 / 23 页