Imagen 3支持人物生成人人可用谷歌Gemini AI重大升级来了bd半岛

2024-08-31 20:40:22

分享到：

　　【新智元导读】时隔5个月，Imagen 3终于可以人人可用了，而且还能支持是生成人物图像。与此同时，谷歌宣布了Gemini AI的重大升级，全新AI定制助手Gems已经面向150多个国家推出。

　　这次，谷歌直接给配上了Gems助手，还有最新图像生成模型Imagen 3！

　　5月的I/O开发者大会上，谷歌首次对外亮相了Imagen 3图像生成的能力。

　　正如当时博文所述，Imagen 3可以根据文本提示，创建出更高质量的图像。

　　另外，Imagen 3设定了图像质量的新标准，只需几个单词就能生成图像。

　　你甚至可以要求Gemini 创作各种风格的图像，比如照片上的写实风景画、纹理油画，或者是异想天开的泥土场景。

　　值得注意的是，谷歌再次引入了生成人类图像的照片。此前，因AI生图人物带上了有色眼镜，谷歌便被全网攻击。

　　为了解决人们对深度造假、错误信息的担忧，谷歌已采取了安全措施，比如水印SynthIDbd半岛。

　　升级后的模型，媒体Ars测试后发现，当让AI生成拜登打篮球的图像时，会被拒绝请求。

　　另外，在一些快速测试中，Imagen 3还避免了生成「历史上不准确」的种族陷阱。

　　比如，让它生成一副英国国王肖像，AI会生成穿着一袭红色长袍，留着胡须的白人，而不是以往种族多元化战士的组合。

　　现在，当你再让Imagen 3去描绘历史场景，便会违反谷歌的人工智能的规则。

　　然而，谷歌Gemini此前毫不避讳地生成出了，穿着纳粹风格衣服的亚洲人、黑人。

　　专门化的人工智能助手Gems支持Gemini Advanced，企业、以及商业用户，面向150多个国家。

　　谷歌希望，这类面向定特任务的AI助手，能够解决像GPT-4o这样通用语言模型的局限性。

　　因为通过专门数据训练/定制的专业助手，能够提供更加实用、更高效的解决方案。

　　过去一年里，包括OpenAI、微软、Meta、Anthropic、HuggingFace等在内的公司，都推出了可定制的AI聊天机器人平台。

　　OpenAI的GPT Store于1月推出之后，开发者们可以创建和分享ChatGPT的定制版本。

　　微软的Copilot Studio，可以让企业能够开发定制的AI助手，而Meta的AI Studio是为了创建定制聊天机器人bd半岛。

　　此时，Gems和Imagen 3的发布，似乎是谷歌试图追赶，甚至赶超竞争对手的一次尝试。

　　一直以来，谷歌是AI研究领域的先驱，但在面向消费者的AI产品推向市场方面，有时会落后于对手。

　　话又说回来，不论是谁家发布，这一新功能可能会对整个行业，产生深远的影响。

　　在教育领域，AI导师可能会提供个性化学习体验；在医疗保健中，专门的AI助手能诊断和治疗规划。

　　尽管谷歌采取了一些强有力的安保措施，但AI发展的步伐已经超过了监管框架。

　　随着AI继续深入日常生活，谷歌Gemini AI可能会激发出这项技术的变革潜力。

　　本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场bd半岛，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。