谷歌的人工智能文本到图像生成器Imagen 3上线
2024-08-16 06:04:14AI云资讯135431

(AI云资讯消息)据外媒报道,谷歌已向美国用户推出了其AI文本到图像生成器Imagen 3的最新版本。该工具可在谷歌的AI Test Kitchen中使用,据称其生成的图像比谷歌之前的模型具有更好的细节、更丰富的光线和更少的分散注意力的瑕疵。
谷歌于5月的I/O大会上首次宣布了其更新后的Imagen 3工具,但似乎只是在最近几天通过其Vertex AI平台将其作为通用工具提供。一些Reddit用户上周开始尝试使用Imagen 3,谷歌周二还发表了一篇关于该工具的研究论文。
与其他AI图像生成器一样,Imagen 3可以根据您的提示生成详细的图像。您还可以通过突出显示某个部分并描述想要更改的内容来编辑图像。

该工具似乎有一些限制,因为它不会生成公众人物或武器的图像。虽然它不会生成有明确版权的特定角色,但可以通过描述你想要创建的角色来轻松绕过这一限制。
尽管这些限制相对灵活,但Imagen 3仍然与马斯克的X平台上的AI图像生成器Grok形成了鲜明对比。Grok被用来生成各种疯狂的内容,包括含有毒品、暴力和公众人物做不端行为的图像。
但谷歌的AI工具也遇到了一些问题。今年早些时候,谷歌停止让人们使用Gemini AI聊天机器人生成图像,因为用户发现它生成的历史上不准确的图像。
相关文章
- 谷歌搜索的人工智能进化包含更多广告
- 谷歌的未来是一个无所不能的搜索框
- Google I/O 2026:Gemini 将成为谷歌年度开发者大会的主角
- 2026智能眼镜“百镜争鸣”,谷歌/阿里/微美全息引领AR/XR产业全面升级
- 谷歌发布 Chromebook 后继产品——Googlebook
- 谷歌称其首次发现并阻止了一个利用AI开发的零日漏洞
- 谷歌首款AI眼镜即将呼之欲出,微美全息(WIMI.US)扎实推进AI+AR生态落地
- 谷歌母公司发布2026年一季度财报,搜索查询量创下历史新高
- 英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
- Siri悄然接入Gemini大模型,苹果反成谷歌云2026 Next大会主角
- 联合谷歌共建:戴盟发布数百万小时触觉具身数据集
- 谷歌将Marvell纳入双芯片TPU计划,ASIC AI推理格局或将重塑
- 谷歌推出Mac版Gemini人工智能应用
- Meta闭源模型Muse Spark登场,谷歌/微美全息加码投入开源AI“严阵以待”
- 谷歌正式接管母公司Alphabet旗下机器人软件企业Intrinsic
- 谷歌云客户业务负责人重返微软,出任安全主管
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









