IBM lanza "Granite": modelos básicos de IA para empresas

IBM lanza "Granite": modelos básicos de IA para empresas

Nodo de origen: 2258305

IBM ha presentado su último avance en el ámbito de inteligencia artificial (IA) para empresas: una serie de modelos básicos denominados “Granito”. Estos modelos, diseñados para la plataforma watsonx.ai, tienen como objetivo aprovechar el poder de la IA generativa para aplicaciones lingüísticas y de codificación.

Modelos de granito: una inmersión profunda

Desarrollados por IBM Research, los modelos Granite, específicamente Granite.13b.instruct y Granite.13b.chat, se basan en una arquitectura "Decoder". Esto sustenta la capacidad de los grandes modelos lingüísticos contemporáneos para predecir palabras posteriores en una secuencia. Con 13 mil millones de parámetros, estos modelos están optimizados para brindar eficiencia y caben en una única GPU V100-32 GB. Su diseño garantiza un impacto ambiental reducido y al mismo tiempo sobresale en tareas comerciales especializadas como resumen, respuesta a preguntas y clasificación.

Los modelos se entrenan en una amplia gama de conjuntos de datos, que ascienden a un preprocesamiento de 7 TB y un posprocesamiento de 2.4 TB, lo que da como resultado 1 billón de tokens. Estos conjuntos de datos abarcan varios dominios, incluidos Internet, el mundo académico, la codificación, el derecho y las finanzas, lo que garantiza que los modelos estén bien versados ​​en el lenguaje y la terminología específicos de la industria.

Confianza y Transparencia: El Compromiso de IBM

IBM enfatiza la confianza y la transparencia en su desarrollo de IA. La plataforma de datos e inteligencia artificial watsonx de la compañía ofrece un proceso integral para crear y probar modelos básicos e inteligencia artificial generativa. Este proceso abarca todo, desde la recopilación de datos hasta la implementación de modelos, con un especial enfoque en la gobernanza, la evaluación de riesgos, la mitigación de sesgos y el cumplimiento.

Para garantizar la integridad de los datos utilizados para la capacitación, IBM ha implementado un riguroso proceso de revisión de gobernanza, riesgo y cumplimiento (GRC). Además, la empresa emplea su "detector HAP", un modelo de lenguaje desarrollado para identificar y eliminar contenido profano y de odio. Esto es parte de la estrategia más amplia de IBM para mitigar los riesgos asociados con la IA generativa.

Empoderamiento a través de la IA

La visión de IBM para la IA en los negocios gira en torno al empoderamiento. La empresa cree que las organizaciones deberían tener autonomía para personalizar sus modelos en consonancia con sus valores, utilizando las herramientas proporcionadas por la plataforma watsonx. Además, IBM garantiza que las empresas conserven la propiedad y el control sobre sus datos y modelos.

El camino por delante

Si bien los modelos Granite marcan un hito importante, son sólo el comienzo del viaje de IBM en este espacio. La compañía tiene planes de introducir más modelos en varios idiomas y también está trabajando en otros modelos entrenados por IBM. IBM también ha anunciado su colaboración con Meta, ofreciendo acceso temprano al modelo de 2 mil millones de parámetros Llama 70-chat de Meta. Además, IBM albergará StarCoder, un modelo de lenguaje integral para codificación.

En las próximas semanas, IBM también lanzará nuevas funciones en watsonx.ai studio, incluidos Tuning Studio y Synthetic Data Generator. Estas herramientas mejorarán aún más las capacidades de la plataforma, permitiendo a las empresas aprovechar todo el potencial de la IA.

En conclusión, la introducción por parte de IBM de los modelos básicos Granite y las herramientas y características posteriores significa una nueva era en la IA para los negocios, con infinitas posibilidades en el horizonte.

Descargo de responsabilidad: El contenido de este artículo tiene fines informativos únicamente y es propiedad exclusiva de Blockchain.News. Si bien nuestro objetivo es la precisión, no ofrecemos garantías con respecto a su confiabilidad o integridad. 

Fuente de la imagen: Shutterstock

Sello de tiempo:

Mas de Blockchain Noticias