Croma Ai: inteligencia artificial gratuita y en español para medios de Latino América.


ACERCA DE Croma Ai

Modelos de Machine Learning Open Source para noticias en español

Croma Ai es un servicio que analiza tus noticias utilizando modelos machine learning para recomendar noticias similares. También identifica entidades mencionadas en tus textos como personas, organizaciones, lugares y más. Todo el procedimiento de entrenamiento es independiente de tu CMS y puede ser integrado luego de manera muy simple a través de una API basada en JSON.


Una de las principales desventajas competitivas de la mayoría de los medios en Latino América es el acceso a tecnología de punta para acompañar su misión periodística. El caso de la inteligencia artificial aplicada a procesos es quizás el mayor déficit respecto a sus pares de Estados Unidos y Europa. Dado que la I.A. es una disciplina nueva, pero que avanza muy rápido, el orden de magnitud de la diferencia se acentúa de manera dramática en muy corto plazo.

Para evitar que esta brecha se acentúe, con el equipo de Croma decidimos hacer algo por los medios en español. Apoyados en el Google GNI Innovation Challenge - que ayudó con la financiación de este proyecto — desarrollamos una herramienta open source para que todos los medios que lo deseen puedan incorporar herramientas de machine learning a sus operaciones digitales.

Creemos en el periodismo y el valor que agrega a la sociedad en su conjunto. Nuestro objetivo con este proyecto es proporcionar la misma o mejor tecnología que las salas de redacción tienen en el mundo anglosajón. Esperamos que las salas de redacción puedan aprovechar el aprendizaje automático para mejorar sus métricas de contenido y objetivos comerciales.

Creemos que si nivelamos el acceso a la tecnología, todos pueden hacer un mejor trabajo al servicio de su público y, por lo tanto, aumentar su poder para marcar la diferencia.

Creemos en el software de código abierto como una forma de proporcionar valor a la comunidad. Por esa razón, el núcleo del proyecto será de código abierto y estará disponible para que cualquiera pueda descargarlo e instalarlo por su cuenta.


EL PROBLEMA QUE RESUELVE

Cómo reutilizar el contenido publicado como fuente de ingresos recurrentes

La mayoría de las limitaciones de la recirculación se deben a cómo se maneja el archivo de noticias: los artículos se etiquetan manualmente y las palabras clave se ingresan manualmente. El archivo de noticias se maneja como un repositorio estático y, en conjunto, se desperdicia como un recurso de ingresos y las historias potencialmente atractivas se entierran debajo de una pila de artículos irrelevantes.


Este problema aparece en diferentes etapas del proceso de noticias, por ejemplo:

  • Al escribir una noticia nueva, es difícil de encontrar y vincular, dentro del desarrollo de historias, artículos del archivo relevantes para el tema
  • Cuando un usuario lee una historia en el sitio web o la aplicación, la mayoría de los CMS generalmente muestran artículos recomendados no relevantes al final de cada historia. Esto se debe a que la recomendación automática generalmente usa etiquetas simples y palabras clave para encontrar relevancia

El gran problema es el etiquetado manual y la manera en que el sistema recomienda noticias relacionadas. Esto implica:

  • Si la recomendación es irrelevante, la recirculación de artículos es baja.
  • Esto provoca poca credibilidad en las recomendaciones
  • Lo cual repercute en una baja recirculación
  • Y afecta de imagen de valor sobre el contenido del sitio
  • Que provoca pérdida de ingresos potenciales de anuncios y suscriptores


BENEFICIOS

Utilice el aprendizaje automático para indexar el archivo histórico y etiquetar automáticamente los artículos, agruparlos en temas y extraer entidades. Todo accesible a través de una API para reutilizar y recomendar contenido relevante en todas sus plataformas.


Noticias relacionadas

Encontrar cualquier noticia publicada en su archivo histórico en milisegundos — sin salir de su CMS. Es habitual ver a periodistas buscando las noticias en Google simplemente porque su buscador interno no tiene la inteligencia necesaria para encontrar lo que están necesitando. Por medio de un modelo entrenado de machine learning, podrán encontrarla directamente al escribir su nota y no sólo por equivalencia de keywords sino por la relevancia real con la noticia que está escribiendo y sus pares históricas de archivo.

Entidades

Identificar y extraer entidades (personas, empresas, organizaciones, lugares) mencionadas en sus noticias y crear mapas de referencia cruzada para ver cómo noticias disímiles se conectan por las mismas entidades y viceversa. Esto le agrega contexto a noticias que a simple vista podrían verse como inconexas.

Automatización

Automatizar la generación de tags y categorización de noticias. Este es uno de los procesos más engorrosos para los periodistas y que fácilmente pueden ser realizados por los procesos de inteligencia artificial aplicada, después de su debido entrenamiento. El paso más importante es que permite generar palabras clave combinados que reafirman la relevancia de artículos relacionados en un entrecruzamiento posterior de contenidos.

Identificación de patrones

Identifique patrones y tendencias en múltiples líneas de tiempo y en múltiples fuentes de contenido a la vez. Conecte los puntos detrás de noticias aparentemente no relacionadas.

Regeneración de etiquetas

Vuelva a etiquetar artículos. Etiquete automáticamente todo el archivo de noticias y recupere cualquier noticia usando combinaciones complejas de palabras clave. La extracción de entidades proporcionará etiquetado adicional por personas, lugares y organizaciones.

Búsqueda relacionada

Redescubrir el archivo a través de la búsqueda inteligente de noticias. Todos los medios trabajan cientos de horas generando contenidos que caen en el olvido y que fácilmente pueden volver a vivir al ser redescubiertos y linkeados desde los nuevos contenidos.


ACERCA DEL MODELO OPEN SOURCE

Croma Ai es software open source de uso libre y gratuito para medios en español

Disponible como Open Source en GitHub, este software, su API y el entrenamiento de modelos pudieron realizarse gracias a un aporte de Google a través de su iniciativa Google News Initiative y el equipo de Croma Inc.

Croma Ai fue desarrollado por completo por Croma Inc para facilitar el acceso de los medios de comunicación de habla hispana a herramientas de machine learning en idioma español. Con años de experiencia en este entorno conocemos la limitaciones y la dificultad de implementar este tipo de tecnología en redacciones grandes, medianas y mucho más en las pequeñas. Por eso desarrollamos Croma Ai como una manera de allanar la barrera de entrada a los desarrolladores y medios que quieran experimentar con estas herramientas dentro de sus redacciones.El uso de este software es exclusivamente gratuito y de libre uso para todo medio de comunicación de América Latina que quiera incorporar machine learnign de manera sencilla a su operación diaria.

Estos son los beneficios que puede obtener su medio utilizando esta plataforma:

  • Realizar un entrenamiento de machine learning de todo su archivo histórico sin necesidad de programar una sola línea de código. Todo lo que necesitas está incluido en este paquete.
  • Incorporar noticias relacionadas en su artículos a través de una simple llamada a una API. Esta relaciones no se dan por simples keywords o categorías, sino que utiliza una comprensión de la totalidad del texto para recomendar noticias similares, por más que no compartan los mismos términos.
  • Identificar personas, lugares, organizaciones y keywords mencionadas en sus textos. Esto permite la automatización de la generación de tags que pueden ser fácilmente utilizados para potenciar sus esfuerzos de SEO y taggeo de artículos, nuevos e históricos.
  • Ofrecer un sistema de búsqueda de artículos basado en relevancia real de sus contenidos. Puede ofrecer búsquedas predictivas y relaciones por entidades en la página de resultados.
  • Cualquier otra tarea que se pueda facilitar teniendo su archivo completo y actualizado indexado y accesible vía API.


ACERCA DE Croma Inc

Croma is una empresa dedicada a la creación de soluciones de machine learning para medios de todo el mundo. Desde 2017 trabajamos con clientes como The Wall Street Journal, BBC News, Le Monde, Huffington Post, The Washington Post y La Nación entre otros ofreciéndoles soluciones para identificar patrones, tendencias y repercusiones de sus noticias diarias en diferentes plataformas. Hoy Croma Inc esta 100% dedicada al desarrollo y soporte de aplicaciones de machine learning. Si desea contactarnos puede enviar un correo a hello@croma.io


ACERCA DE GOOGLE NEWS INITIATIVE

Google News Initiative es una iniciativa de colaboración con el sector del periodismo para que prospere en la era digital. Iniciado por Google, es un esfuerzo de trabajo en conjunto con la industria para construir un futuro más sólido para el periodismo. Desde su creación, Google ha tenido la oportunidad de trabajar con más de 350 organizaciones de noticias en 70 países para comprender y enfrentar mejor los desafíos más críticos que enfrentan las organizaciones de noticias en todo el mundo. Aquí puede conocer más acerca de la GNI.

Ir al inicio