Amazon Kinesis es una oferta de AWS. Se trata de un conjunto de servicios para el procesamiento de datos en streaming que pueden ser analizados en tiempo real.
El servicio Amazon Kinesis permite analizar en tiempo real datos que antes se procesaban por lotes. Los datos en streaming, en particular, pueden utilizarse mejor y más rápidamente con la ayuda de la oferta de la nube, que proporciona Amazon Web Services (AWS). El software de análisis tiene cuatro subfunciones para diferentes casos de uso: Video Streams, Data Streams, Data Firehose, Data Analytics.
Por ejemplo, el uso de datos en tiempo real siempre juega un papel importante cuando diferentes aplicaciones necesitan intercambiar datos rápidamente entre sí. Kinesis se utiliza para procesar grandes cantidades de datos de streaming o datos en tiempo real procedentes de otras fuentes con latencias muy bajas.
Almacenamiento, encapsulación, indexación de datos de streaming
Kinesis Video Streams permite transmitir a AWS datos de vídeo procedentes de dispositivos conectados. Allí, los datos pueden procesarse en tiempo real, por ejemplo para el aprendizaje automático u otros análisis. Cuando se trata de otros datos, como flujos de clics, fuentes de medios sociales, eventos de seguimiento de la ubicación, archivos de registro o flujos de eventos de bases de datos, se puede utilizar Kinesis Data Streams. Este servicio de streaming escalable ingiere continuamente cantidades muy grandes de datos procedentes de diversas fuentes.
Como los datos recogidos de este modo están disponibles en milisegundos, los usuarios comerciales pueden utilizarlos, por ejemplo, para la fijación de precios dinámicos o la detección de anomalías en tiempo real. El pago se basa en las horas de flujos de datos de Kinesis utilizados.
Utilidades de cotejo y análisis de datos
Kinesis Data Firehose es un servicio totalmente gestionado que permite cargar datos en streaming en el almacenamiento, los lagos de datos y los servicios de análisis. A continuación, puede transferirse a otros servicios como Redshift, Elasticsearch o S3 para su posterior procesamiento. Alternativamente, los datos pueden ponerse a disposición de los sistemas de análisis de proveedores como Splunk, New Relic o Datadog.
Para procesar los datos en tiempo real con SQL o Apache Flink, se puede utilizar Kinesis Data Analytics. El servicio reduce la complejidad de utilizar Apache Flink, un marco de trabajo de código abierto en el que se pueden crear, gestionar e integrar aplicaciones. Además, son compatibles las aplicaciones de streaming construidas con el SDK Java de Apache Beam y en un entorno Apache Flink sin servidor.