Recomendado

Twitter ha abierto todo su catálogo de mensajes a un motor de búsqueda, lo que significa que la totalidad de su contenido, a unos 500 mil millones de documentos, está disponible para tamizar a través de Internet.

La red social lanzó hace unos ocho años y medio, y ahora dice tener unos 284 millones de usuarios activos mensuales.

Twitter: el ingeniero Yi Zhuang dijo en un blog que la búsqueda mejorada y ampliada requiere mucho trabajo.

"Desde aquel primer simple tweet hace más de ocho años, cientos de miles de millones de tweets han capturado las experiencias humanas cotidianas y los principales acontecimientos históricos", escribió.

"Pero nuestro objetivo de larga data ha sido dejar que la gente busca a través de cada tweet que haya sido publicada. Nosotros [hemos] construido un servicio de búsqueda que indexa eficientemente aproximadamente medio billón de documentos y sirve consultas con una latencia media de 100 ms bajo."

El motor de búsqueda tiene todo el canon de mensajes de 140 caracteres a su disposición, y Zhuang sugerido que sería tener una variedad de aplicaciones, especialmente para las empresas o personas en busca de contenido en un incidente o evento.

El nuevo índice es 100 veces más grande que la anterior, y crece por "varios miles de millones de tweets a la semana", según el ingeniero. Esto podría ser un buen momento para que los usuarios de Twitter que se remontan a sus cuentas y eliminar los tweets de dudosos para evitar que resurgen y avergonzarlos.

El sistema es una mezcla de la agregación de datos por lotes, las particiones y la indexación, y es escalable, fácil de usar y confiable, según Zhuang.

"Nuestros grupos de índices en tiempo real de tamaño fijo no son triviales para expandir;. Añadir capacidad requiere re-partición y la sobrecarga operativa significativa Necesitábamos un sistema que se expande en su lugar con gracia."

0 comentarios