产品展示

使用 Amazon Titan 模型和 Amazon Bedrock Agents 创建你的时尚助手


使用 Amazon Titan 模型和 Amazon Bedrock Agents 创建时尚助手应用程序

作者 Akarsha Sehwag Alex Newton Chris Pecora Maira Ladeira Tanke Antonia Wiebeler 和 Yanyan Zhang发布日期 2024年10月4日分类 Amazon Bedrock、Amazon 机器学习、人工智能 、生成式 AI永久链接 文章链接

关键要点

结合 Amazon Titan 模型与 Amazon Bedrock Agents 可以构建功能强大的时尚助手应用,提供个性化的用户体验。该申请支持文本到图像和图像到图像的搜索、图像生成、天气 API 连接以及背景替换等功能。集成时尚助手应用可以为电子商务平台和移动应用提供无缝用户体验,使客户能够上传图片或描述样式以获取个性化建议。

在生成式 AI 时代,能够模拟人类行为的代理成为企业创建生产就绪应用程序的强大工具。这些代理可以与用户交互、执行任务并展现决策能力,模仿人类智能。通过结合来自 Amazon Titan 在 Amazon Bedrock 的基础模型,客户可以开发多模态复杂应用,使代理能够理解并生成自然语言或图像。

例如,在时尚零售行业,利用代理和多模态模型的助手可以为客户提供个性化和沉浸式体验。助手可以进行自然语言对话,理解客户的偏好和意图,然后利用多模态能力分析服装图片并根据客户的输入提供建议。此外,代理还可以生成视觉辅助材料,如搭配建议,提升客户的整体体验。

本文将实现一个时尚助手代理,使用 Amazon Bedrock Agents 和 Amazon Titan 系列模型。该时尚助手提供个性化的多模态对话体验。我们将使用 Amazon Titan 图像生成器 来生成时尚灵感和编辑用户照片。通过 Amazon Titan 多模态嵌入 模型,用户可以使用提供的文本提示或参考图片在数据库中搜索样式。 Anthropic Claude 3 Sonnet 被用来协调代理行动,例如获取当前天气以提供天气适合的服装建议。使用 Streamlit 提供的简单网络 UI,用户可以更好地与代理互动。

时尚助手代理能够顺畅融入现有电商平台或移动应用,提供无缝且愉悦的客户体验。客户可以上传自己的图片、描述所需样式,或甚至提供参考图片,代理将生成个性化的建议和视觉灵感。

本解决方案所用代码可在 GitHub 仓库 中获取。

解决方案概览

此时尚助手代理利用 Amazon Titan 模型和 Amazon Bedrock Agents 的强大功能,向用户提供全面的时尚相关功能:

功能描述图像到图像或文本到图像搜索帮助客户找到与他们喜欢的样式相似的产品,增强用户体验。我们使用 Titan 多模态嵌入模型将每个产品图像嵌入并存储在 Amazon OpenSearch Serverless 中以备后续检索。文本到图像生成如果所需样式未在数据库中可用,该工具将根据用户的查询生成独特、定制的图像,实现个性化样式的创造。天气 API 连接通过获取用户提示中提到的给定位置的天气信息,代理可以为特定场合建议合适的样式。外扩用户可以上传图像并请求更改背景,以便在不同场景中可视化其偏好样式。内补允许用户修改上传图像中的特定服装项,例如更改设计或颜色,同时保持背景完整。

下图展示了决策过程的流程图:

相应的架构图如下:

前提条件

要设置时尚助手代理,请确保您具备以下条件:

一个活跃的 AWS 账户,具备 Amazon Bedrock、AWS Lambda 和 Amazon Simple Storage (Amazon S3) 访问权限的 AWS 身份和访问管理 (IAM) 角色安装所需的 Python 库,例如 Streamlit在 Amazon Bedrock 中启用 Anthropic Claude 3 Sonnet、Amazon Titan 图像生成器和 Amazon Titan 多模态嵌入模型。您可以在 Amazon Bedrock 控制台的模型访问页面确认这些模型是否已启用。如果这些模型已启用,访问状态将显示为访问授权,如下图所示。

在运行 GitHub 仓库中提供的 notebook 之前,请确保您的 AWS 账户具有以下权限:

创建托管的 IAM 角色和策略创建和调用 Lambda 函数创建、读取和写入 S3 存储桶访问和管理 Amazon Bedrock 代理和模型

如果您希望启用图像到图像或文本到图像搜索功能,还需要为 AWS 账户授予额外权限:

在 OpenSearch Serverless 上创建安全策略、访问政策、收集、索引和索引映射调用 OpenSearch Serverless 上的 BatchGetCollection

设置时尚助手代理

要设置时尚助手代理,请按照以下步骤操作:

使用命令克隆 GitHub 仓库

bash git clone

完成先决条件以授予足够的权限。根据 READMEmd 中的步骤进行部署。(可选) 如果您希望使用 imagelookup 功能,可以在 opensearchingestipynb 中执行代码片段,使用 Amazon Titan 多模态嵌入来嵌入和存储样本图像。使用命令运行 Streamlit UI,与代理交互。

bash streamlit run frontend/apppy

通过遵循这些步骤,您可以创建一个强大且引人入胜的时尚助手代理,该代理结合了 Amazon Titan 模型的能力与 Amazon Bedrock Agents 的自动化和决策能力。

测试时尚助手

设置好时尚助手后,您可以通过 Streamlit UI 与之互动。请按照以下步骤操作:

飞鱼加速器app下载导航至您的 Streamlit UI,如下图所示:

上传一张图像或输入描述所需样式的文本提示,根据需要进行图像搜索、图像生成、外扩或内补。以下截图展示了一个示例提示。

按回车键将提示发送给代理。您可以在 UI 中查看代理的思考链 (CoT) 过程,如下图所示:

当响应准备好时,您可以在 UI 中查看代理的回复,如下图所示。响应可能包括生成的图像、相似样式推荐或基于您的请求修改的图像。您可以直接从 UI 下载生成的图像或在您的 S3 存储桶中查看图像。

清理

为了避免不必要的费用,请确保删除在此解决方案中使用的资源。您可以通过运行以下命令来执行此操作。

bashcdk destroy

结论

由 Amazon Titan 模型和 Amazon Bedrock Agents 提供支持的时尚助手代理展示了零售商如何创建创新应用,提升客户体验并推动业务增长。通过使用此解决方案,零售商可以获得竞争优势,向客户提供个性化的样式建议、视觉灵感和互动时尚建议。

我们鼓励您探索构建更多此类代理的潜力,您可以查阅 awssamples GitHub 仓库 中的示例。

作者介绍

Akarsha Sehwag 是 AWS 专业服务的数据科学家和机器学习工程师,拥有超过5年的构建基于机器学习解决方案的经验。她充分利用计算机视觉和深度学习领域的专业知识,帮助客户高效利用 AWS 云的机器学习。伴随生成式 AI 的兴起,她与众多客户合作,识别好的用例,并将其构建成生产就绪的解决方案。

Yanyan Zhang 是亚马逊网络服务的高级生成式 AI 数据科学家,专注于前沿的 AI/ML 技术,作为生成式 AI 专家帮助客户利用生成 AI 实现其期望结果。Yanyan 毕业于德克萨斯 AampM 大学,获得电气工程博士学位。在工作之外,她喜欢旅行、健身和探索新事物。

Antonia Wiebeler 是 AWS 生成 AI 创新中心的数据科学家,她喜欢为客户建立概念验证。她的激情是探索生成式 AI 如何解决现实世界问题并为客户创造价值。当她不在编程时,她喜欢跑步和参加铁人三项比赛。

Alex Newton 是 AWS 生成 AI 创新中心的数据科学家,帮助客户利用生成 AI 和机器学习解决复杂问题。他喜欢将最新的机器学习解决方案应用于现实世界挑战。闲暇时,您可以发现 Alex 在乐队演出或观看现场音乐。

使用 Amazon Titan 模型和 Amazon Bedrock Agents 创建你的时尚助手

Chris Pecora 是亚马逊网络服务的生成 AI 数据科学家。他热衷于构建创新产品和解决方案,同时专注于以客户为中心的科学。在不进行实验和追踪生成式 AI 的最新进展时,他喜欢与孩子们共度时光。

Maira Ladeira Tanke 是 AWS 的高级生成 AI 数据科学家。她在机器学习方面拥有10年以上的经验,曾与不同行业的客户合作设计和构建 AI 应用。作为技术负责人,她帮助客户加速通过 Amazon Bedrock 的生成式 AI 解决方案实现商业价值的过程。在业余时间,Maira 喜欢旅行、与猫嬉戏及与家人共度温馨时光。

在 AWS reInvent 2022 上构建可持续性架构 架构博客

AWS reInvent 2022的可持续架构文章重点概述在AWS reInvent 2022大会上,有关可持续发展的24场分会、讲座和研讨会得到了广泛关注。本文将概述这些会谈和公告,并讨论它们在云计...