Microsoft quiere llevar la IA generativa a la interfaz del sistema operativo Windows y a las computadoras que lo ejecutan.
En un par de conferencias magistrales durante su conferencia anual Build Developer esta semana, la compañía presentó una nueva gama de dispositivos Windows que llama Copilot + PC, así como funciones generativas impulsadas por IA como Recall, que ayudan a los usuarios a encontrar aplicaciones, archivos y otros contenidos. Necesitan. La están buscando. visto en el pasado. Copilot, la marca de Microsoft para IA generativa, pronto se integrará más profundamente en la experiencia de Windows 11 y los nuevos dispositivos Microsoft Surface están en camino.
Hemos reunido todos los anuncios clave del lunes y martes aquí.
Aplicaciones volumétricas
Microsoft está incorporando aplicaciones volumétricas de Windows (aplicaciones de realidad virtual esencialmente interactivas y con conciencia espacial) a los auriculares Meta Quest. Al asociarse con Meta, Microsoft dice que proporcionará Windows 365 y conectividad de PC local a los auriculares Quest, lo que permitirá a los desarrolladores extender sus aplicaciones al espacio 3D.
Durante el discurso de apertura del martes, Microsoft mostró una representación digital en 3D de la consola Xbox desde la perspectiva de los auriculares Meta Quest 3, un objeto digital que los usuarios pueden manipular con sus manos. «Estamos profundizando nuestra asociación con Meta para hacer de Windows una experiencia de primera clase en los dispositivos Quest», dijo durante la demostración Pavan Davuluri, vicepresidente ejecutivo de Windows y dispositivos de Microsoft.
Los desarrolladores pueden Regístrese para ver Para obtener acceso a la nueva API de volumen de Microsoft.
Copiloto + ordenadores
Las PC Copilot+ representan la visión de Microsoft de dispositivos Windows innovadores y basados en la IA. Todos incluyen chips dedicados llamados NPU para impulsar experimentos de IA como Recall. Se envía con un mínimo de 16 GB de RAM, junto con almacenamiento SSD.
Las primeras PC Copilot+ contarán con Snapdragon de Qualcomm Los fabricantes de chips Intel y AMD también están comprometidos a fabricar procesadores para dispositivos Copilot+ en asociación con una variedad de fabricantes, incluidos Acer, Asus, Dell, HP, Lenovo y Samsung.
El precio de las PC Copilot+ comienza en $999 y algunas están disponibles para pedidos anticipados hoy.
Surface Pro y portátil Surface
Los dispositivos Surface recientemente presentados por Microsoft, Surface Laptop y Surface Pro, se centran en el rendimiento y la batería.
La última Surface Laptop, disponible con una pantalla de 13,8 o 15 pulgadas, ha sido rediseñada con “líneas modernas” y biseles de pantalla más delgados. La compañía dice que el dispositivo dura hasta 22 horas con una carga, que es hasta un 86% más rápido que el Surface Laptop 5. También es compatible con Wi-Fi 7 y tiene un panel táctil capacitivo.
En cuanto al nuevo Surface Pro, Microsoft dice que es hasta un 90% más rápido que el Surface Pro de la generación anterior (Surface Pro 9) y tiene una nueva pantalla OLED con pantalla HDR, Wi-Fi 7 (y 5G opcional) y una cámara frontal ultra ancha mejorada. Y el teclado desmontable, que ha sido reforzado con fibra de carbono adicional, ahora tiene retroalimentación háptica.
Él recuerda
Una próxima función de recuperación en Windows 11 podría «recordar» a qué aplicaciones y contenido accedió un usuario en su computadora hace semanas o incluso meses, ayudándolo, por ejemplo, a encontrar un chat de Discord donde hablaban de la ropa que estaban pensando en comprar. Los usuarios pueden usar la línea de tiempo de Recall para «retroceder» y ver en qué han estado trabajando en el pasado reciente y profundizar en archivos como presentaciones de PowerPoint para ver información que puede ser relevante para sus búsquedas.
Microsoft dice que Recall puede crear asociaciones entre colores, imágenes y más para permitir a los usuarios buscar prácticamente cualquier cosa en sus computadoras en lenguaje natural (no muy diferente a la tecnología de la startup Rewind); Los desarrolladores podrán mejorar la recuperación agregando información contextual a sus aplicaciones. Microsoft afirma que todos los datos de usuario asociados con Recall permanecen privados y residen en el dispositivo, y no se utilizan para entrenar modelos de IA, lo cual es importante.
aquí más De Microsoft: “Tus instantáneas son tuyas; permanecen locales en tu computadora. Puedes eliminar instantáneas individuales, ajustar y eliminar intervalos de tiempo en la configuración o pausarlas en cualquier momento directamente desde el ícono en la bandeja del sistema en la barra de tareas. filtrar aplicaciones y sitios web para que nunca se guarden.
Edición de imágenes y traducciones en vivo.
Ahora hay más IA en Windows que nunca y parte de ella es exclusiva de las nuevas PC Copilot+.
Una nueva función llamada Supersolution puede restaurar fotos antiguas ampliándolas automáticamente. Copilot ahora puede analizar imágenes para brindar a los usuarios ideas para composiciones creativas. A través de una función llamada Cocreator, los usuarios pueden crear imágenes y también hacer que el modelo de IA siga lo que dibujan para cambiar o rediseñar la imagen.
En otros lugares, Live Captions con subtítulos traduce cualquier audio que pasa a través de una computadora, ya sea de YouTube o de un archivo local, al idioma que elija el usuario. Inicialmente, las traducciones en vivo admitirán alrededor de 40 idiomas, incluidos inglés, español, mandarín y ruso.
Una nueva característica separada pero relacionada en Microsoft Edge proporciona traducción de videos en tiempo real en sitios como LinkedIn, YouTube, Coursera, Reuters, CNBC, Bloomberg y más. Programada para estar disponible en un futuro próximo, esta función admite traducción de español a inglés, inglés a alemán, hindi, italiano, ruso y español, y traduce contenido hablado mediante doblaje y subtítulos en vivo.
Copiloto y accesorios
Team Copilot es la última expansión de la creciente cartera de tecnologías de IA generativa Copilot de Microsoft. Se integra con Teams, la aplicación de videoconferencia de la empresa, para ayudar a gestionar las agendas de las reuniones y tomar notas de las que cualquiera en la reunión puede ser coautor. Se extiende a Loop y Planner, las plataformas de planificación y colaboración de Microsoft, para crear y asignar tareas, realizar un seguimiento de los plazos y notificar a los miembros del equipo cuando se necesita su opinión.
En noticias algo relacionadas con Copilot, Microsoft ha lanzado (en vista previa privada) Copilot Extensions, que permiten a los desarrolladores ampliar la propia herramienta de generación de código de GitHub, GitHub Copilot, con aplicaciones y habilidades de terceros. Los socios de lanzamiento incluyen DataStax, Docker y LambdaTest; Las extensiones residirán en GitHub Marketplace, pero los desarrolladores también podrán crear sus propias extensiones para integrarlas con sus sistemas internos y API.
Tiempo de ejecución de Copilot en Windows
Para desactivar capacidades como Recall y Supersolution está Windows Copilot Runtime, una colección de alrededor de 40 modelos de IA generativa que conforman lo que Microsoft describe como una “nueva capa” de Windows. Combinado con Semantic Index, un sistema basado en vectores nativo de una PC Copilot+ individual, Windows Copilot Runtime permite que aplicaciones impulsadas por IA, incluidas aplicaciones de terceros, se ejecuten sin necesidad de una conexión a Internet.
«[The runtime] Consta de API de IA listas para usar, como efectos de estudio, subtítulos en vivo, OCR, recuperación con actividad del usuario y [more]Davuluri dijo el martes que la aplicación estará disponible para los desarrolladores en junio.
Microsoft dice que CapCut, el popular editor de video del propietario de TikTok, ByteDance, utilizará Windows Copilot Runtime y la nueva biblioteca Windows Copilot que lo acompaña, un conjunto de API y herramientas de desarrollo de IA, para acelerar sus funciones de IA. Meta agregará los efectos de estudio anteriores a WhatsApp para ofrecer funciones como desenfoque de fondo y contacto visual durante las videollamadas.
Actualizar constructores de robots
Azure AI Studio, el conjunto de herramientas dentro del servicio Azure OpenAI de Microsoft que permite a los clientes combinar un modelo de IA y crear una aplicación que «piensa» en esos datos, pronto permitirá a los desarrolladores crear aplicaciones utilizando API de inferencia de pago por uso: API a través del cual los desarrolladores pueden acceder y ajustar modelos de IA generativa alojados en la infraestructura de Azure. Microsoft llama a esto el “modelo como servicio” y, para empezar, lo lanzará con modelos de Nixtla y Core42.
En el conjunto de productos adyacente Copilot Studio, Microsoft está lanzando Copilot Agents, que la compañía describe como robots de inteligencia artificial que pueden «coordinar de forma autónoma tareas adaptadas a roles y funciones específicas». (Copilot Studio proporciona herramientas para conectar Copilot para Microsoft 365, el “copilot” impulsado por IA en aplicaciones como Excel y Word, con datos de terceros). Al aprovechar la memoria y el conocimiento del contexto, los agentes de Copilot pueden navegar por diferentes tipos de flujos de trabajo empresariales, aprender de los comentarios de los usuarios y pedir ayuda cuando se encuentran con situaciones que no saben cómo afrontar.
Kit de desarrollo de Snapdragon
Hay un nuevo kit de desarrollo de Qualcomm dirigido a desarrolladores que crean aplicaciones para PC Copilot+ equipadas con chips Arm
El Snapdragon Dev Kit de $899.99 para Windows, que mide aproximadamente el mismo ancho, alto y largo que el Mac Mini de Apple, alberga el Snapdragon de Qualcomm y muchas operaciones de E/S. El kit de desarrollo admite Wi-Fi 7 y Bluetooth 5.4 y, a través de sus diversos puertos USB-C y HDMI, puede alimentar hasta tres pantallas 4K simultáneamente.
PHI-3
Microsoft anunció una incorporación a la familia de modelos de IA generativa de Phi, Phi-3-vision, que puede realizar tareas de razonamiento y análisis visual general, como responder preguntas sobre gráficos e imágenes. El modelo puede leer tanto texto como imágenes y es lo suficientemente eficiente como para ejecutarse en un dispositivo móvil.
El Phi-3-vision está disponible en versión preliminar, mientras que las contrapartes de solo texto del modelo anunciadas anteriormente (Phi-3-mini, Phi-3-small y Phi-3-medium) ahora están disponibles de forma general.
Asociación con la Academia Khan
Microsoft se está asociando con Khan Academy para donar acceso a la infraestructura de computación en la nube, lo que permitirá a Khan Academy brindar a los educadores en los Estados Unidos acceso gratuito a las herramientas impulsadas por inteligencia artificial de Khan Academy. Microsoft dijo el martes que las dos empresas también colaborarán para explorar oportunidades para mejorar las aplicaciones de IA para la enseñanza de matemáticas a través de la IA generativa.
¡Estamos lanzando un boletín informativo impulsado por IA! suscripción aquí Para empezar a recibirlos en tus bandejas de entrada el 5 de junio.
«Gurú del alcohol. Analista. Defensor de la comida. Aficionado extremo al tocino. Experto total en Internet. Adicto a la cultura pop. Pionero de viajes sutilmente encantador».