Cuando a los diseñadores de la empresa de juguetes Mattel se les pidió recientemente que crearan un nuevo modelo de automóvil Hot Wheels, recurrieron a DALL∙E 2, una fórmula de IA impulsada por OpenAI que crea fotografías e ilustraciones tradicionales sobre lo que otras personas describen en un lenguaje innegable.
Con la herramienta, los diseñadores pueden escribir un mensaje como «Un estilo a escala de un automóvil antiguo» y DALL∙E 2 generará un símbolo de un automóvil de juguete antiguo, de color plateado con llantas de banda blanca.
En el próximo paso, el diseñador puede simplemente borrar el techo del automóvil, luego escribir «Make it cabriolet» y DALL∙E 2 actualizará el símbolo del automóvil como convertible. El diseñador puede continuar con los ajustes de diseño, pidiéndole a DALL∙ E 2 para comprobarlo en rosa o azul, con la parte superior y más.
DALL∙E 2 llega al servicio Azure OpenAI solo por invitación de Microsoft, lo que permite a los usuarios de Azure AI generar fotografías tradicionales a través de texto o fotografías, anunció hoy la compañía en Microsoft Ignite, una convención para desarrolladores y profesionales de TI.
La disponibilidad de DALL∙E 2 a través del servicio Azure OpenAI brinda a los clientes, como Mattel, una infraestructura de inteligencia artificial basada en la nube que combina la innovación de vanguardia de la generación de texto a imagen con las protecciones y certificaciones culpables de inteligencia artificial y el cumplimiento. presentado a través de Azure, dice Microsoft.
Los diseñadores de Mattel debían generar docenas de imágenes, con cada iteración generando y refinando ideas que podrían ayudar a diseñar una representación completa de un nuevo modelo de automóvil Hot Wheels.
«Se trata de pensar, ‘¡Oh, no pensé en eso!'», dijo Carrie Buse, directora de diseño de productos en Mattel Future Lab en El Segundo, California. Ella ve la generación de IA como una herramienta para ayudar a los diseñadores a generar más ideas. «Al final del día, la calidad es lo más importante», dijo. «Pero la cantidad puede ayudarlo a encontrar la calidad».
Microsoft también está integrando DALL∙E 2 en sus programas y servicios de cliente, con la aplicación Microsoft Designer recientemente anunciada, que pronto se incorporará con Image Creator en Microsoft Bing.
El lanzamiento de DALL∙E 2 en los productos de Microsoft refleja cómo la inversión de la compañía en estudios de IA infunde IA en todo lo que construye, produce y entrega para ayudar a todos a impulsar la productividad y la innovación.
Según Eric Boyd, vicepresidente de AI Platshape de Microsoft, esta tendencia es el resultado de los avances no lineales en las funciones de IA logradas al llevar más cómputo a más conocimiento para dar forma a modelos más ricos y resistentes.
«La fuerza de los modelos ha cruzado este umbral de calidad y ahora es útil en más aplicaciones», dijo. «La otra tendencia que estamos viendo es que todos los desarrolladores de productos están pensando en cómo pueden usar IA en sus productos, ya sea para facilidad de uso y decir: ‘Oh, puedo hacer que las pinturas de mis productos sean mejores si uso IA'».
DALL∙E 2 se ejercitó en una supercomputadora alojada en Azure que Microsoft construyó exclusivamente para OpenAI. La misma supercomputadora de Azure también se usó para ejercitar los estilos de lenguaje herbal OpenAI y Codex GPT-3, el estilo que impulsa a GitHub Copilot y algunos Microsoft Power Propósitos de aplicaciones que se ejecutan en el servicio Azure OpenAI. Azure también permite que esos equipos de IA generen temporalmente sugerencias de imágenes, texto o código que un usuario puede revisar y usar.
La incorporación de DALL∙E 2 se basa en la asociación continua de Microsoft con OpenAI y amplía la diversidad de instancias de uso dentro del servicio Azure OpenAI, el miembro más reciente del círculo de familiares de Azure Cognitive Services recientemente en vista previa, que brinda seguridad, confiabilidad, cumplimiento, privacidad y otras funciones empresariales integradas en Microsoft Azure.
Otras tecnologías de IA evolucionaron a través de Microsoft y disponibles a través de Azure Cognitive Services, como la traducción de idiomas, la transcripción de voz, el reconocimiento óptico de caracteres y la síntesis de documentos, y han comenzado a aparecer en productos como Microsoft Teams, Microsoft Power Platform y Microsoft 365. .
«Durante los últimos 18 meses, noté esta transición en la tecnología, desde demostrar que se puede hacer cosas con IA hasta mapearla en escenarios y procesos del mundo real donde es útil para el usuario final», dijo Charles Lamanna, vicepresidente de Microsoft. de programas y plataformas de negocios. » Es la producción de esos maravillosos modelos de lenguaje».
Estas funciones de IA apuntan a trabajos tediosos y permiten a los pintores concentrarse en tareas de mayor valor, como liberar a los vendedores para iniciar conversaciones con los consumidores sin tener que tomar notas, dijo Lamanna. Estos nuevos equipos también pueden automatizar procesos que últimamente consumen horas de trabajo. pinturas, como escribir resúmenes de llamadas de ventas y agregarlos a una base de datos de visitantes.
«Ahora podemos inyectar IA que escucha nuestro intercambio verbal y está ayudando a otras personas a ser más productivas mediante la creación de transcripciones, la captura de elementos de acción, el resumen de la reunión, la identificación de frases no inusuales o la actuación de un análisis, ‘¿Soy un oyente inteligente?’Lamanna dijo: «Esto ha requerido el avance de la IA de próxima generación y el avance de esas herramientas de colaboración virtual».
Lamanna se enfoca en equipos de construcción que permiten a cualquier persona con un dispositivo informático crear sus propias aplicaciones basadas en IA Microsoft Power Platform. Por ejemplo, su equipo implementa una función en Power Automate con funciones de copiloto impulsadas por IA que permiten a los usuarios usar hierbas lenguaje para crear procesos de flujo de trabajo que conectan múltiples instalaciones que se ejecutan en la nube de Microsoft.
«Los usuarios pueden decir en lenguaje general: ‘Oye, cada vez que recibo un correo electrónico de mi jefe, envío un mensaje de texto a mi teléfono y ubico una tarea en mi Outlook'», explicó Lamanna. automáticamente. «
Esta habilidad para convertir una oración en un flujo de trabajo aumenta drásticamente la cantidad de otras personas que pueden crear soluciones de software basadas en inteligencia artificial, dijo. disponible en Power Platform, como la generación inteligente de procesamiento de documentos en AI Builder, agregó.
Un abogado puede simplemente usar esta generación para crear una aplicación tradicional que se activa cada vez que se carga un nuevo contrato en el sitio de SharePoint de la empresa. Esta aplicación puede simplemente extraer datos clave como el del contrato, las partes involucradas y el sector de la industria. , y luego enviar por correo electrónico un resumen del contrato con esos puntos principales a los abogados de la empresa que cubre el sector o clientes.
«Es como magia», dijo Lamanna, contrastando este tipo de flujo de trabajo de IA automatizado con la forma en que se llevan a cabo esas responsabilidades hoy en día. quieres hacer cualquier cosa con él. AI saca a otras personas de esta monotonía y obliga a las computadoras a hacer lo que es más productivo para ellos de todos modos».
La transformación virtual de los últimos años se ha sumado a la avalancha de contenido producido por otras personas en todo el mundo. Los clientes de Microsoft, por ejemplo, ahora cargan alrededor de 1600 millones de piezas de contenido cada día a Microsoft 365. Piense en presentaciones de marketing, contratos, facturas. y pedidos de pintura, así como grabaciones de video y transcripciones de reuniones de Teams.
«Crean documentos, colaboran en ellos desde Teams y los compran en experiencias basadas en SharePoint», dijo Jeff Teper, presidente de aplicaciones y plataformas colaborativas de Microsoft. «Lo que debemos hacer es integrar tecnologías de inteligencia artificial en este contenido para que los consumidores puede llevar a cabo actividades más estructuradas, como aprobaciones de contratos, gestión de facturas y presentaciones regulatorias».
Es por eso que Microsoft creó Microsoft Syntex, una nueva IA de contenido que proporciona Microsoft 365 que aprovecha Azure Cognitive Services y otras tecnologías de IA para la forma en que se crea, procesa y descubre el contenido. Lea, etiquete e indexe contenido, ya sea virtual o en papel, haciéndolo Se puede buscar y estar disponible en programas rápidos o como conocimiento reutilizable. También puede administrar el ciclo de vida del contenido con configuraciones de seguridad y retención.
Por ejemplo, TaylorMade Golf Company recurrió a Microsoft Syntex en busca de una fórmula integral de control de documentos para organizar y proteger correos electrónicos, archivos adjuntos y otros documentos para activos intelectuales y presentación de patentes. En ese momento, los abogados de la empresa trataban este contenido manualmente, dedicando horas a archivar y moviendo documentos a porcentaje y trámite posterior.
Con Microsoft Syntex, esos documentos se clasifican, clasifican y filtran automáticamente, de una manera más segura y menos difícil de ubicar a través de búsqueda en lugar de un sistema clásico de registro y carpetas. TaylorMade también está explorando tácticas para usar Microsoft Syntex para procesar pedidos automáticamente, recibos y otros documentos transaccionales para los equipos de cuentas por pagar y finanzas.
Otros consumidores usan Microsoft Syntex para el control y el montaje de contratos, dijo Teper. Si bien ambos contratos podrían tener elementos exclusivos, están construidos con cláusulas comunes sobre términos monetarios, control de reemplazo, cronograma, etc. En lugar de escribir esas cláusulas comunes de raspe tanto una vez como las dos, los usuarios pueden usar Syntex para unirlos a partir de documentos y luego hacer reemplazos.
«Quieren que la IA y el dispositivo aprendan a detectar, ‘Oye, este párrafo es muy diferente de nuestras condiciones populares. Esto requiere un poco de monitoreo adicional», dijo.
«Si está buscando leer un contrato de 100 páginas y descubrir qué se reemplaza significativamente, eso es mucho trabajo en comparación con la IA», agregó. «Y luego está el flujo de trabajo en torno a esos contratos: ¿quién los aprueba?¿Dónde se almacenan?, ¿cómo localizarlos después?, hay mucho de eso que son metadatos.
La disponibilidad de DALL∙E 2 en el servicio Azure OpenAI ha desencadenado una serie de exploraciones en RTL Deutschland, la empresa privada de medios cruzados más grande de Alemania, sobre cómo generar fotografías tradicionales basadas en los intereses de los visitantes. Por ejemplo, en RTL’s Data, Research y AI Competency Center, los científicos del conocimiento están probando diversos métodos para que el usuario disfrute del uso de fotografías generativas.
El servicio de transmisión RTL de RTL Deutschland ha comenzado a expandirse para ofrecer a pedido millones de videos, álbumes de música, podcasts, audiolibros y revistas electrónicas. La plataforma se basa en gran medida en fotografías para captar la atención de las personas «, dijo Marc Egger, vicepresidente senior presidente de productos de conocimiento y generación del equipo de conocimiento de RTL.
«Incluso si tiene la mejor recomendación, aún no sabe si el usuario hará clic en ella, porque el usuario usa señales visuales para saber si está interesado en comer algo. Por lo tanto, las representaciones son muy vitales y debe tener la información correcta». representación para la persona adecuada», dijo.
Imagine una película de comedia romántica sobre un jugador de fútbol profesional que es transferido a París y se enamora de un periodista deportivo francés. Un aficionado a los deportes podría ser más susceptible de ver la película si hay una imagen de un partido de fútbol. Alguien a quien le encanta el romance. novelas o podría estar más interesado en un símbolo de la pareja besándose bajo la Torre Eiffel.
La combinación de la fuerza de DALL∙E 2 y los metadatos sobre el tipo de contenido con el que ha interactuado un usuario en el más allá brinda la oportunidad de proporcionar fotografías tradicionales en una escala en el más allá inconcebible, dijo Egger.
“Si tienes millones de usuarios y millones de activos, tienes el desafío de que no puedes escalarlos, no existe”, dijo. “Nunca tendrás suficientes diseñadores gráficos para crear todas las fotografías tradicionales que deseas. Así que es la generación la que te permite hacer cosas que no podrías hacer de otra manera».
El equipo de Egger también comenzó a pensar en cómo usar DALL∙E 2 en Azure Open AI Service para crear símbolos para contenido que últimamente carece de símbolos, como episodios de podcast y escenas de audiolibros. Por ejemplo, los metadatos de un episodio de podcast pueden usarse generar un símbolo de soltero para acompañarlo, que repetir el mismo símbolo de podcast genérico una y otra vez.
Del mismo modo, un usuario que escuche un audiolibro en su teléfono verá la misma cubierta de libro electrónico para cada uno de los capítulos. DALL∙E 2 solo se puede usar para generar un símbolo de soltero para acompañar cada una de las escenas en cada uno de los capítulos. capítulo.
El uso de DALL∙E 2 a través del servicio Azure OpenAI, agregó Egger, brinda acceso a otros Azure y equipos en un solo lugar, lo que le permite a su equipo trabajar con éxito y sin problemas». Al igual que con todos los demás productos de software como servicio, podemos Tenga la certeza de que si queremos crear una gran cantidad de fotografías a través de DALL∙E, no nos preocupamos por tenerlas en línea».
Ninguna generación de IA ha generado tanto entusiasmo como sistemas como DALL∙E 2 que pueden generar fotografías a partir de descripciones de lenguaje herbal, según Sarah Bird, gerente de asignaciones de la organización central de Microsoft para Azure AI.
«A la gente le encantan las imágenes, y para alguien como yo, artísticamente visual, puedo hacer cualquier cosa mucho más hermosa de lo que podría hacer con otras herramientas visuales», dijo sobre DALL∙E. Da a los seres humanos una nueva herramienta para expresar de manera creativa y hablan de manera convincente, risueña y atractiva.
Su equipo tiene como objetivo desarrollar equipos y técnicas que asesoren a otras personas sobre el uso adecuado y culpable de equipos de IA como DALL∙E 2 en Azure AI y restringir su uso de una manera que pueda causar daño.
Para ayudar a evitar que DALL∙E 2 ofrezca efectos secundarios al servicio Azure OpenAI, OpenAI eliminó contenido sexual y violento más específico del conjunto de datos utilizado para ejercitar el modelo, y Azure AI implementó filtros para rechazar mensajes que violan los política de contenido.
Además, el equipo incorporó técnicas que le evitan a DALL∙E 2 crear fotografías de celebridades, así como elementos que se usan comúnmente para engañar a la fórmula y generar contenido sexual o violento. Por el lado de la salida, el equipo agregó plantillas que elimine fotografías generadas por IA que parezcan involucrar contenido para adultos, gore y otros tipos de contenido fuera de lugar.
DALL∙E 2 aún enfrenta un desafío que enfrentan muchas fórmulas de IA: la calidad de la fórmula en el conocimiento utilizado para ejercitarla. Sin las ventajas del contexto que brinda información sobre la intención del usuario, las activaciones menos descriptivas de DALL-E 2 pueden revelar sesgos. incrustados en el ejercicio del conocimiento: texto y fotografías de Internet.
Es por eso que Bird trabaja con los grupos de productos de Microsoft para enseñar a otras personas cómo usar DALL∙E 2 en tácticas que los ayuden a lograr sus objetivos, como actividades más descriptivas que ayuden a la fórmula de IA a percibir mejor los efectos que están buscando.
«Estamos diseñando las interfaces para ayudar a los usuarios a lograr lo que están construyendo y porcentaje de las barreras hoy, de modo que los usuarios puedan usar esta herramienta para obtener la representación que desean, no la representación promedio que existe en Internet. Internet». ella dijo.
Buse se unió recientemente a Mattel Future Lab, que explora conceptos como el metaverso y NFT, o tokens no fungibles, para expandir el éxito de la industria del juguete. Utiliza DALL∙E 2 como una herramienta para ayudarla a creer lo que esos virtuales los informes podrían parecerse.
«Es divertido cavar aquí para pensar en cómo se vería en un global virtual basado en, optando por un descriptor, un bosque, sirenas, lo que sea», dijo, explicando que DALL∙E 2 está ayudando a su equipo a esperar que futuro. » ¿Cómo esperamos el futuro?Continúas alimentándote de más información, más imágenes y mente para comprobar cómo se producirá.
Boyd, vicepresidente de Microsoft AI Platform, dijo que DALL∙E 2 y el círculo de familiares de modelos de lenguaje gigante liberan esta fuerza artística entre los usuarios. La fórmula de IA es un combustible para la imaginación, lo que permite a los usuarios pensar en conceptos nuevos y atractivos. y darles vida en sus presentaciones y documentos.
«Creo que lo más emocionante es que solo tenemos que arañar la superficie de la fuerza de esos maravillosos modelos de lenguaje», dijo.
Contenido relacionado:
Leer: Cómo la IA da vida a los expansores y está ayudando a todos a estar informados sobre cómo expandir el software
Lean: nueva calidad y potencia de plantillas Z-code Mixture of Experts en Traductor y Azure AI
Lean: el nuevo servicio Azure OpenAI se combina con modelos de lenguaje GPT-3 resistentes con capacidades comerciales de Azure
Imagen destacada: Los diseñadores de juguetes de Mattel exploran cómo usar las fotografías generadas a través de DALL∙E 2 en el servicio Azure OpenAI para ayudar a motivar nuevos diseños de Hot Wheels. o «Una fuerza motriz de Bonneville Salt Flats como un automóvil de carrera DTM», pueden generar fotografías para estimular la creatividad y contar diseños definitivos.
John Roach escribe sobre innovación en Microsoft. Sígalo en Twitter.
Seguir:
Comparte esta página: