图标开源 - 搜索 News

什么值得买 on MSN2 天

做设计时总会遇到图标的问题：要么找不到合适的图标，要么风格不统一，要么需要反复调整大小和颜色。特别是在多人协作的项目中，图标的规范和一致性更是让人头 ...

目前，将大模型变成Agent的关键难点在于，需要能够可靠地识别用户界面中的可交互图标，同时必须理解截图中各种元素的语义，并准确将预期动作与屏幕上的对应区域关联起来。微软在官网发布了视觉Agent解析框架OmniParser最新版本V2.0，可将DeepSeek-R1、GPT-4o、Qwen ...

1 天

AGI开源助力行业突破，搜狐简单AI让普通人也能玩转AI艺术！

AGI的开源意味着更多人能够接触到先进的AI技术，而搜狐简单AI正是将这些技术转化为普通人也能轻松使用的工具。无论是AI绘画还是图片处理，搜狐简单AI都能让用户在几分钟内完成专业级的作品。比如，用户只需输入一段文字描述，就能生成一幅精美的AI画作；或 ...

17 小时

DeepSeek开源助力中国AI发展，清华浙大为何成为关键力量？

DeepSeek的开源举措和高校的课程开设，标志着中国AI领域进入了一个新的发展阶段。正如DeepSeek创始人梁文峰所说，‘没有象牙塔——只有纯粹的车库能量和社区驱动的创新’，这种开放与合作的精神，正是推动中国AI发展的重要力量。

腾讯网6 天

DeepSeek 等秒变操控电脑 AI 智能体，微软开源 OmniParser V2.0

IT之家 2 月 17 日消息，微软 OmniParser 是一款基于纯视觉的 GUI 智能体解析和识别屏幕上可交互图标的 AI 工具，此前搭配 GPT-4V 可显著增强识别能力。2 月 12 日，微软在官网发布了 OmniParser 最新版本 ...

腾讯网6 天

微软开源创新框架：可将DeepSeek，变成AI Agent

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！微软在官网发布了视觉Agent解析框架OmniParser最新版本V2.0，可将DeepSeek-R1、GPT-4o、Qwen-2.5VL等模型，变成可在计算机使用的AI ...

5 天on MSN

微软OmniParser V2.0：让AI模型秒变电脑操控高手，已开源

微软近期在人工智能领域再次迈出重要一步，推出了OmniParser V2.0，这是一款基于纯视觉技术的GUI智能体解析工具，能够精准识别并解析屏幕上的可交互图标。此前，该工具与GPT-4V的结合已显著提升了其识别能力。

站长之家5 天

微软开源创新框架:可将DeepSeek，变成AI Agent

除了V2，微软还开源了omnitool，这是一个基于Docker的 Windows 系统，涵盖屏幕理解、定位、动作规划和执行等功能，也是将大模型变成Agent的关键工具。目前，将大模型变成Agent的关键难点在于，需要能够可靠地识别用户界面中的可交互图标，同时必须理解截图中 ...

来自MSN5 天

微软发布开源OmniParser V2.0，秒变操控电脑AI智能体，颠覆传统办公模式

颠覆传统办公模式，微软发布OmniParser V2.0，AI智能体引领新潮流随着科技的飞速发展，人工智能（AI）的应用已经渗透到我们生活的方方面面。近日，微软发布的OmniParser ...

凤凰网5 天

DeepSeek等秒变操控电脑AI智能体，微软开源工具OmniParser V2.0发布

与 V1 版本相比，OmniParser V2 使用了更大规模的交互元素检测数据和图标功能标题数据 ... 不同的智能体设置，微软还开源了 OmniTool，这是一个集成 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果